亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

您當前的位置是:  首頁 > 資訊 > 國際 >
 首頁 > 資訊 > 國際 >

自然語言處理服務Amazon Comprehend現(xiàn)支援Word和PDF文件格式

2021-09-17 14:43:38   作者:   來源:CTI論壇   評論:0  點擊:


  過去Amazon Comprehend只能處理純文字dangan,而現(xiàn)在還能處理Word和PDF文件dangan,以及筆記或是列表等數(shù)據(jù)內(nèi)容。
  AWS更新自然語言處理服務Amazon Comprehend,開始支援Word和PDF文件,讓用戶可以從這些類型的dangan擷取數(shù)據(jù)。Amazon Comprehend能夠分析不同語言的文字,並且辨識這些文字的內(nèi)容,諸如人名、地點、品牌和產(chǎn)品等,同時還能理解文本中的關(guān)鍵句子和情緒,或?qū)Υ罅课募膬?nèi)容,依照主題加以分類。
  無論是開設銀行帳戶、申請保險或是房屋借款等程序,皆大量使用紙本文件,而這些文件動則超過百頁,對於企業(yè)來說,手動處理這些文件是一件繁瑣的工作,不只需要人工,而且速度緩慢容易出錯,而藉由使用Amazon Comprehend,可以大幅加速文件的創(chuàng)建和管理,並且降低出錯機率。
  Amazon Comprehend新的解決方案,可處理PDF、Word和原始文字等dangan格式,或是筆記和列表等布局,並進行內(nèi)容擷取和分析,AWS提到,這次推出的解決方案,結(jié)合自然語言處理和光學字元辨識技術(shù),能夠減少企業(yè)文件的預處理和後處理工作量,用戶不再需要將dangan轉(zhuǎn)換成原始文本,就能夠使用自定義命名實際辨識(NER)功能。
  過去Amazon Comprehend只能處理純文字dangan,這需要用戶先將文件整理成機器可讀的文本,但用戶現(xiàn)在能夠利用Amazon Comprehend以相同的API,直接從PDF和Word中的文字或是列表等不同文件布局,擷取特定詞語。
  新的Amazon Comprehend自定義實體辨識模型,綜合分析結(jié)構(gòu)上下文和自然語言上下文,從文件中的任何位置,擷取自定義實體。AWS提到,用戶對于每一種實體類型,只要提供250個文件和100個注解,即可訓練模型並且開始使用該功能,而為了要掃描PDF並擷取空間位置,Amazon Comprehen。d會呼叫Amazon Textract服務,來執(zhí)行必要的處理。
  這項新功能有助於企業(yè)處理保險、抵押、金融等業(yè)務中的文件處理工作流程,通常這些文件布局復雜,用戶也不需要頁面上的每一個數(shù)據(jù)點,因此擷取特定資訊存在困難,而Amazon Comprehend這項新功能,可以使用機器學習,使用單個模型和API呼叫,快速擷取自定義的詞語,像是處理汽車或健康保險文件中的索賠金額,甚至是在抵押貸款中,擷取申請人姓名、共同簽署人或是其他財務文件資訊等
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

CTI論壇會員企業(yè)