亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

<li id="8igia"><dl id="8igia"></dl></li>

<dl id="8igia"></dl>

<center id="8igia"><noscript id="8igia"></noscript></center>

您當(dāng)前的位置是：首頁 > 資訊 > 國內(nèi) >

首頁|資訊|文章精選|商城|黃頁|會(huì)展|訪談|人才|資源|專家團(tuán)隊(duì)|周刊|呼叫中心|企業(yè)通信|通信業(yè)務(wù)

首頁 > 資訊 > 國內(nèi) >

“四大模型”革新NLP技術(shù)應(yīng)用，揭秘百度文心ERNIE最新開源預(yù)訓(xùn)練模型

2021-05-31 14:34:37 作者：來源：CTI論壇評(píng)論：0 　點(diǎn)擊：

　　在5月20日結(jié)束的2021深度學(xué)習(xí)開發(fā)者峰會(huì)WAVE SUMMIT上，百度文心ERNIE開源了四大預(yù)訓(xùn)練模型。本文對(duì)這四大開源預(yù)訓(xùn)練模型進(jìn)行了詳細(xì)的技術(shù)解讀。

　　2019年以來，NLP預(yù)訓(xùn)練模型在技術(shù)創(chuàng)新和工業(yè)應(yīng)用上不斷取得突破，但當(dāng)前預(yù)訓(xùn)練模型仍有一些痛點(diǎn)困擾著開發(fā)者：

僅考慮單一粒度語義建模，缺乏多粒度知識(shí)引入，語義理解能力受限；
受限于Transformer結(jié)構(gòu)的建模長度瓶頸，無法處理超長文本；
聚焦語言等單一模態(tài)，缺乏工業(yè)真實(shí)應(yīng)用場(chǎng)景針對(duì)多個(gè)模態(tài)如語言、視覺、聽覺信息的聯(lián)合建模能力。

　　5月20日舉辦的2021深度學(xué)習(xí)開發(fā)者峰會(huì)WAVE SUMMIT上，依托飛槳核心框架，百度文心ERNIE最新開源四大預(yù)訓(xùn)練模型：多粒度語言知識(shí)增強(qiáng)模型ERNIE-Gram、長文本理解模型ERNIE-Doc、融合場(chǎng)景圖知識(shí)的跨模態(tài)理解模型ERNIE-ViL、語言與視覺一體的模型ERNIE-UNIMO。

　　針對(duì)當(dāng)前預(yù)訓(xùn)練模型現(xiàn)存的難點(diǎn)痛點(diǎn)，此次文心ERNIE開源的四大預(yù)訓(xùn)練模型不僅在文本語義理解、長文本建模和跨模態(tài)理解三大領(lǐng)域取得突破，還擁有廣泛的應(yīng)用場(chǎng)景和前景，進(jìn)一步助力產(chǎn)業(yè)智能化升級(jí)。

　　文心ERNIE開源版地址：https://github.com/PaddlePaddle/ERNIE

　　文心ERNIE官網(wǎng)地址：https://wenxin.baidu.com/

　　一、多粒度語言知識(shí)增強(qiáng)模型ERNIE-Gram

　　從ERNIE模型誕生起，百度研究者們就在預(yù)訓(xùn)練模型中引入知識(shí)，通過知識(shí)增強(qiáng)的方法提升語義模型的能力。本次發(fā)布的ERNIE-Gram模型正是通過顯式引入語言粒度知識(shí)，從而提升模型的效果。具體來說，ERNIE-Gram提出顯式n-gram掩碼語言模型，學(xué)習(xí)n-gram粒度語言信息，相對(duì)連續(xù)的n-gram掩碼語言模型大幅縮小了語義學(xué)習(xí)空間，（V^n→V_(n-gram)，其中V為詞表大小，n為建模的gram長度），顯著提升預(yù)訓(xùn)練模型收斂速度。

▲圖1-1連續(xù)n-gram掩碼語言模型vs顯式n-gram掩碼語言模型

　　此外，在顯式n-gram語義粒度建�；A(chǔ)上，ERNIE-Gram提出多層次n-gram語言粒度學(xué)習(xí)，利用two-stream雙流機(jī)制，實(shí)現(xiàn)同時(shí)學(xué)習(xí)n-gram語言單元內(nèi)細(xì)粒度（fine-grained）語義知識(shí)和n-gram語言單元間粗粒度（coarse-grained）語義知識(shí)，實(shí)現(xiàn)多層次的語言粒度知識(shí)學(xué)習(xí)。

▲圖1-2n-gram多層次語言粒度掩碼學(xué)習(xí)

　　ERNIE-Gram在不增加任何計(jì)算復(fù)雜度的前提下，在自然語言推斷任務(wù)、短文本相似度任務(wù)、閱讀理解任務(wù)等多個(gè)典型中文任務(wù)上，效果顯著超越了業(yè)界主流開源預(yù)訓(xùn)練模型。此外，ERNIE-Gram英文預(yù)訓(xùn)練模型也在通用語言理解任務(wù)、閱讀理解任務(wù)上效果超越主流模型。

　　ERNIE-Gram的方法被NAACL2021主會(huì)長文錄用，論文地址：

　　https://arxiv.org/abs/2010.12148

　　二、長文本理解模型ERNIE-Doc

　　Transformer是ERNIE預(yù)訓(xùn)練模型所依賴的基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)，但由于其計(jì)算量和空間消耗隨建模長度呈平方級(jí)增加，導(dǎo)致模型難以建模篇章、書籍等長文本內(nèi)容。受到人類先粗讀后精讀的閱讀方式啟發(fā)，ERNIE-Doc首創(chuàng)回顧式建模技術(shù)，突破了Transformer在文本長度上的建模瓶頸，實(shí)現(xiàn)了任意長文本的雙向建模。

　　通過將長文本重復(fù)輸入模型兩次，ERNIE-Doc在粗讀階段學(xué)習(xí)并存儲(chǔ)全篇章語義信息，在精讀階段針對(duì)每一個(gè)文本片段顯式地融合全篇章語義信息，從而實(shí)現(xiàn)雙向建模，避免了上下文碎片化的問題。

　　此外，傳統(tǒng)長文本模型（Transformer-XL等）中RecurrenceMemory結(jié)構(gòu)的循環(huán)方式限制了模型的有效建模長度。ERNIE-Doc將其改進(jìn)為同層循環(huán)，使模型保留了更上層的語義信息，具備了超長文本的建模能力。

▲圖2-1ERNIE-Doc中的回顧式建模與增強(qiáng)記憶機(jī)制

　　通過讓模型學(xué)習(xí)篇章級(jí)文本段落間的順序關(guān)系，ERNIE-Doc可以更好地建模篇章整體信息。

▲圖2-2篇章重排序?qū)W習(xí)

　　ERNIE-Doc顯著提升了長文本的建模能力，可以解決很多傳統(tǒng)模型無法處理的應(yīng)用難題。例如在搜索引擎中，ERNIE-Doc可以對(duì)網(wǎng)頁整體理解，返回用戶更加系統(tǒng)的結(jié)果。在智能創(chuàng)作中，ERNIE-Doc可以用來生成更加長篇、語義豐富的文章。

　　超長文本理解模型ERNIE-Doc在包括閱讀理解、信息抽取、篇章分類、語言模型等不同類型的13個(gè)典型中英文長文本任務(wù)上取得最優(yōu)的效果。

　　ERNIE-Doc的方法被ACL2021主會(huì)長文錄用，論文鏈接：

　　https://arxiv.org/abs/2012.15688

　　三、融合場(chǎng)景圖知識(shí)的跨模態(tài)理解模型ERNIE-ViL

　　跨模態(tài)的信息處理能力需要人工智能模型深入理解并綜合語言、視覺、聽覺等模態(tài)的信息。當(dāng)前，基于預(yù)訓(xùn)練的跨模態(tài)語義理解技術(shù)，通過對(duì)齊語料學(xué)習(xí)跨模態(tài)的聯(lián)合表示，將語義對(duì)齊信號(hào)融合到聯(lián)合表示中，從而提升跨模態(tài)語義理解能力。ERNIE-ViL提出了知識(shí)增強(qiáng)的視覺-語言預(yù)訓(xùn)練模型，將包含細(xì)粒度語義信息的場(chǎng)景圖（Scene Graph）知識(shí)融入預(yù)訓(xùn)練過程，構(gòu)建了物體預(yù)測(cè)、屬性預(yù)測(cè)、關(guān)系預(yù)測(cè)三個(gè)預(yù)訓(xùn)練任務(wù)，使得模型在預(yù)訓(xùn)練過程中更加關(guān)注細(xì)粒度語義知識(shí)，學(xué)習(xí)到能夠刻畫更好跨模態(tài)語義對(duì)齊信息，得到更好的跨模態(tài)語義表示。

▲圖3-1知識(shí)增強(qiáng)的跨模態(tài)預(yù)訓(xùn)練ERNIE-ViL框架

　　ERNIE-ViL首次將場(chǎng)景圖知識(shí)融入跨模態(tài)模型的預(yù)訓(xùn)練過程，為跨模態(tài)語義理解領(lǐng)域研究提供了新的思路。該模型在視覺問答、視覺常識(shí)推理、引用表達(dá)式理解、跨模態(tài)文本&圖像檢索等5個(gè)典型跨模態(tài)任務(wù)上取得了領(lǐng)先的效果。ERNIE-ViL模型也逐步在視頻搜索等真實(shí)工業(yè)應(yīng)用場(chǎng)景中落地。

　　ERNIE-ViL的方法被AAAI-2021主會(huì)長文錄用，論文地址:

　　https://arxiv.org/abs/2006.16934

　　四、語言與視覺一體的模型ERNIE-UNIMO

　　大數(shù)據(jù)是深度學(xué)習(xí)取得成功的關(guān)鍵基礎(chǔ)之一。當(dāng)前的預(yù)訓(xùn)練方法，通常分別在各種不同模態(tài)數(shù)據(jù)上分別進(jìn)行，難以同時(shí)支持各類語言和圖像的任務(wù)�；谏疃葘W(xué)習(xí)的AI系統(tǒng)是否也能像人一樣同時(shí)學(xué)習(xí)各種單模、多模等異構(gòu)模態(tài)數(shù)據(jù)呢？如果能夠?qū)崿F(xiàn)，無疑將進(jìn)一步打開深度學(xué)習(xí)對(duì)大規(guī)模數(shù)據(jù)利用的邊界，從而進(jìn)一步提升AI系統(tǒng)的感知與認(rèn)知的通用能力。

　　為此，語言與視覺一體的模型ERNIE-UNIMO提出統(tǒng)一模態(tài)學(xué)習(xí)方法，同時(shí)使用單模文本、單模圖像和多模圖文對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練，學(xué)習(xí)文本和圖像的統(tǒng)一語義表示，從而具備同時(shí)處理多種單模態(tài)和跨模態(tài)下游任務(wù)的能力。此方法的核心模塊是一個(gè)Transformer網(wǎng)絡(luò)，在具體訓(xùn)練過程中，文本、圖像和圖文對(duì)三種模態(tài)數(shù)據(jù)隨機(jī)混合在一起，其中圖像被轉(zhuǎn)換為目標(biāo)（object）序列，文本被轉(zhuǎn)換為詞（token）序列，圖文對(duì)被轉(zhuǎn)換為目標(biāo)序列和詞序列的拼接。統(tǒng)一模態(tài)學(xué)習(xí)對(duì)三種類型數(shù)據(jù)進(jìn)行統(tǒng)一處理，在目標(biāo)序列或者詞序列上基于掩碼預(yù)測(cè)進(jìn)行自監(jiān)督學(xué)習(xí)，并且基于圖文對(duì)數(shù)據(jù)進(jìn)行跨模態(tài)對(duì)比學(xué)習(xí)，從而實(shí)現(xiàn)圖像與文本的統(tǒng)一表示學(xué)習(xí)。進(jìn)一步的，這種聯(lián)合學(xué)習(xí)方法也讓文本知識(shí)和視覺知識(shí)互相增強(qiáng)，從而有效提升文本語義表示和視覺語義表示的能力。

　　此方法在語言理解與生成、多模理解與生成，4類場(chǎng)景、共13個(gè)任務(wù)上超越主流的文本預(yù)訓(xùn)練模型和多模預(yù)訓(xùn)練模型，同時(shí)登頂權(quán)威視覺問答榜單VQA、文本推理榜單aNLI。首次驗(yàn)證了通過非平行的文本與圖像單模數(shù)據(jù)，能夠讓語言知識(shí)與視覺知識(shí)相互增強(qiáng)。

　　此工作被ACL2021主會(huì)長文錄用，論文地址:

　　https://arxiv.org/abs/2012.15409

　　五、破解NLP技術(shù)難題，助力產(chǎn)業(yè)智能化

　　文心ERNIE全新開源發(fā)布4大預(yù)訓(xùn)練模型，不斷推動(dòng)NLP模型技術(shù)研究層面的創(chuàng)新與應(yīng)用。

　　語言與知識(shí)技術(shù)被看作是人工智能認(rèn)知能力的核心。2019年以來，百度憑借在自然語言處理領(lǐng)域的深厚積累取得了系列世界突破，發(fā)布了文心ERNIE語義理解平臺(tái)，該平臺(tái)廣泛用于金融、通信、教育、互聯(lián)網(wǎng)等行業(yè)，助力產(chǎn)業(yè)智能化升級(jí)。

　　作為“人工智能皇冠上的明珠”，NLP領(lǐng)域向來是人工智能技術(shù)研發(fā)與落地實(shí)踐的前沿。百度文心平臺(tái)基于領(lǐng)先的語義理解技術(shù)，幫助企業(yè)在NLP賽道上跨過技術(shù)、工具、算力、人才等門檻，對(duì)開發(fā)者和企業(yè)進(jìn)行開放，全面加速NLP技術(shù)助力全產(chǎn)業(yè)智能化升級(jí)，為AI工業(yè)大生產(chǎn)插上智能的“翅膀”。

　　百度自然語言處理（Natural Language Processing，NLP）以‘理解語言，擁有智能，改變世界’為使命，研發(fā)自然語言處理核心技術(shù)，打造領(lǐng)先的技術(shù)平臺(tái)和創(chuàng)新產(chǎn)品，服務(wù)全球用戶，讓復(fù)雜的世界更簡(jiǎn)單。

【免責(zé)聲明】本文僅代表作者本人觀點(diǎn)，與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立，不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考，并請(qǐng)自行承擔(dān)全部責(zé)任。

相關(guān)熱詞搜索：百度 ERNIE NLP

上一篇:瞻博網(wǎng)絡(luò)發(fā)布Apstra Software，將意圖網(wǎng)絡(luò)提升至更高水平

下一篇:最后一頁

相關(guān)閱讀：

·云智一體讓視頻更優(yōu)質(zhì)！2021-05-25 09:31:48
·百度愛番番400電話，助近山律所解決管理之亂2021-03-05 10:50:37
·百度聯(lián)合恒拓開源，共同布局民航智能客服云生態(tài)2021-03-05 09:40:09
·百度智能云：當(dāng)保險(xiǎn)遇上AI，泰康保險(xiǎn)集團(tuán)智能化升級(jí)有秘籍2021-02-23 09:26:05
·百度研究院發(fā)布2021年十大科技趨勢(shì)預(yù)測(cè)2021-01-14 10:05:38
·2020百度云智峰會(huì)：百度攜手環(huán)信共建智能客服新業(yè)態(tài)2020-12-30 10:44:00
·合力億捷出席2020百度云智峰會(huì)，獲“2020年卓越服務(wù)獎(jiǎng)”2020-12-24 09:38:34
·2020百度云智峰會(huì) | 遠(yuǎn)傳科技攜手百度智能云共建“云智新生態(tài)”2020-12-22 14:00:23
·百度CTO王海峰榮膺第十三屆光華工程科技獎(jiǎng)2020-11-09 10:13:15
·百度智能云兩項(xiàng)大獎(jiǎng)再入囊中！2020-10-13 09:18:01

評(píng)論排行

推薦閱讀

專題

變革時(shí)代聯(lián)絡(luò)中心...: 　　該系列文章探討了推動(dòng)變革的趨勢(shì)，回顧了當(dāng)今聯(lián)絡(luò)中...[詳細(xì)]

2021中國呼叫中心...: 2021中國呼叫中心及企業(yè)通信大會(huì) 4月15日中國·北京 ...[詳細(xì)]

華為全聯(lián)接2020: 華為第五屆HUAWEI CONNECT大會(huì)在上海舉辦。[詳細(xì)]

2020中國呼叫中心...: 業(yè)界矚目的2020中國呼叫中心及企業(yè)通信大會(huì)將于7月9日在...[詳細(xì)]

大家都在看

點(diǎn)擊排行
周排行
月排行

CTI論壇會(huì)員企業(yè)

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079688
傳真：+86-10-62041062
投稿：ctiforum@ctiforum.com
地址：北京市西城區(qū)新德街20號(hào)513室（100088）

網(wǎng)站首頁 | 公司簡(jiǎn)介 | 聯(lián)系方式 | 工作機(jī)會(huì) | 廣告服務(wù) | 會(huì)員服務(wù) | 服務(wù)項(xiàng)目 | 專家團(tuán)隊(duì) | 版權(quán)聲明 | 投稿方法

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079688 投稿：ctiforum@ctiforum.com

經(jīng)營性網(wǎng)站備案信息

京ICP證030771號(hào)

網(wǎng)絡(luò)110報(bào)警服務(wù)

京公網(wǎng)安備110102000104-1號(hào)

<abbr id="4gyqq"></abbr>

<option id="4gyqq"></option>

<abbr id="4gyqq"><source id="4gyqq"></source></abbr>

<nav id="4gyqq"></nav>