亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

您當(dāng)前的位置是:  首頁(yè) > 資訊 > 文章精選 >
 首頁(yè) > 資訊 > 文章精選 >

WAIC·開(kāi)發(fā)者日|竹間智能CEO簡(jiǎn)仁賢談NLP落地修煉之道

2020-07-13 09:53:46   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  7月11日,2020WAIC·開(kāi)發(fā)者日特設(shè)「構(gòu)建AI基礎(chǔ)設(shè)施」分論壇,邀請(qǐng)包括華為、騰訊、竹間智能、京東云等業(yè)內(nèi)多家企業(yè)專(zhuān)家共同探討這一話(huà)題。竹間智能CEO&創(chuàng)始人簡(jiǎn)仁賢將以《“懂語(yǔ)言者得天下”NLP落地修煉之道》為主題,分享新基建建設(shè)及企業(yè)數(shù)字化、智能化轉(zhuǎn)型新思路。
  以下分享分論壇演講實(shí)錄
  分論壇實(shí)錄
  大家都知道自然語(yǔ)言處理是人工智能里的掌上明珠。人工智能主要包含視覺(jué)、語(yǔ)音跟自然語(yǔ)言處理,而其中NLP自然語(yǔ)言處理是其中最難的部分,我相信大家都已經(jīng)認(rèn)同。那么視覺(jué)跟語(yǔ)音的發(fā)展也已經(jīng)經(jīng)過(guò)了一段時(shí)間,技術(shù)也相對(duì)比較成熟,場(chǎng)景也比較固定。
  那么自然語(yǔ)言理解的場(chǎng)景有多么浩瀚?自然語(yǔ)言理解需要處理的問(wèn)題有多少呢?我們?nèi)绾伟炎匀徽Z(yǔ)言理解結(jié)合人工智能的技術(shù),在行業(yè)里去落地,通過(guò)行業(yè)應(yīng)用的場(chǎng)景能夠產(chǎn)生更多的價(jià)值,這個(gè)是我們今天要來(lái)探討的問(wèn)題。
  竹間智能從2015年成立到現(xiàn)在的5年里,一直以自然語(yǔ)言為核心,以情感計(jì)算為基礎(chǔ),打造流暢的人機(jī)交互,追求有溫度的交互機(jī)器人,來(lái)解決人跟機(jī)器溝通的問(wèn)題。不僅如此,我們也在解決人機(jī)協(xié)作的問(wèn)題。竹間將自然語(yǔ)言處理技術(shù)應(yīng)用到解決非結(jié)構(gòu)化數(shù)據(jù),也就是從文本分析的范疇,把人機(jī)交互溝通、協(xié)同的問(wèn)題,也同時(shí)運(yùn)用到業(yè)務(wù)自動(dòng)化,流程自動(dòng)化,解決業(yè)務(wù)上的問(wèn)題,提供更好的端到端的服務(wù)。所以自然語(yǔ)言理解、情感計(jì)算是竹間智能的兩大主軸。
  近5年來(lái)竹間一直在沉淀和積累行業(yè)的場(chǎng)景,今天來(lái)跟大家分享一下自然語(yǔ)言理解如何去落地。以前我的老上司沈向洋博士曾講過(guò)一句話(huà):“懂語(yǔ)言者得天下”就是說(shuō)未來(lái)的世界里面,不論是生活,工作或是娛樂(lè),各個(gè)方面會(huì)有語(yǔ)言來(lái)輔助。不管這個(gè)語(yǔ)言是人跟人溝通的語(yǔ)言,還是人跟機(jī)器的溝通的語(yǔ)言,或者是未來(lái)幻想中一個(gè)機(jī)器跟機(jī)器溝通的語(yǔ)言,語(yǔ)言會(huì)成為一個(gè)人類(lèi)生活層面的操作系統(tǒng),所以懂語(yǔ)言者得天下,如果能夠?qū)⒄Z(yǔ)言了解透徹,就能幫助人類(lèi)在言語(yǔ)的溝通上起到協(xié)同和賦能的作用。
  竹間在過(guò)去5年來(lái),已經(jīng)把自然語(yǔ)言的這些技術(shù)應(yīng)用到各行各業(yè),沉淀下來(lái)非常多的場(chǎng)景,并把場(chǎng)景轉(zhuǎn)化成了產(chǎn)品和平臺(tái),把產(chǎn)品做成平臺(tái),把平臺(tái)當(dāng)作產(chǎn)品。目的是幫助企業(yè)把NLP應(yīng)用更快落地,更安全、更順暢、更低成本、更高效率。依靠竹間Bot Factory™這樣的產(chǎn)品平臺(tái)沉淀了數(shù)百個(gè)標(biāo)桿客戶(hù),5年來(lái)不斷的以自主研發(fā)的自然語(yǔ)言理解跟情感計(jì)算的技術(shù)和知識(shí)工程技術(shù)為基礎(chǔ),搭建出平臺(tái),讓機(jī)器人真的能夠看得懂,聽(tīng)得懂,讀得懂,也能夠去解決所有的人的業(yè)務(wù)的問(wèn)題。竹間智能一直以來(lái)的愿景:
  Emotional Robot for everyone,
  every business,and every smart device
  所以我們是來(lái)連接人、商業(yè)和終端三個(gè)為一體的一個(gè)環(huán)節(jié),來(lái)做情感機(jī)器人,能夠賦能于人類(lèi)生態(tài)。
  把握NLP的契機(jī)
  今天要跟大家講的是如何在人的生活當(dāng)中去找到NLP的契機(jī),對(duì)于企業(yè)來(lái)講,我們?nèi)绾稳ベx能企業(yè)來(lái)幫助個(gè)人生活得更好、更便利、更有效。
  企業(yè)內(nèi)普遍存在以下難點(diǎn),第一,營(yíng)銷(xiāo)獲客,企業(yè)能夠獲客,能夠有新的業(yè)務(wù)才能生存,才能提給客戶(hù)更好的服務(wù)。
  第二點(diǎn),提高服務(wù)的質(zhì)量。有了新客戶(hù),如何去服務(wù)已有客戶(hù)進(jìn)行留存和轉(zhuǎn)化,則需要提供更好的體驗(yàn),讓企業(yè)能夠有持續(xù)性的商機(jī),讓客戶(hù)享受到更好,更值得的高質(zhì)量服務(wù)。那么還有最核心的一點(diǎn)是企業(yè)要減少人力成本,加上今年疫情給大家?guī)?lái)的一個(gè)思考,就是:未來(lái)如何在各個(gè)環(huán)節(jié)減少人力的壓力,進(jìn)而減少用工成本?通過(guò)技術(shù)來(lái)降低用工成本和壓力。未來(lái)世界其實(shí)將會(huì)減少接觸。更少的接觸,不代表沒(méi)有社交,社交當(dāng)然必不可少,所以需要社交距離,但是能不需要接觸的時(shí)候,就要盡量避免。
  比如說(shuō)要繳費(fèi),一定要去網(wǎng)點(diǎn)繳嗎?要辦信用卡一定要去網(wǎng)點(diǎn)辦嗎?如果辦信用卡通過(guò)電話(huà),機(jī)器人能否幫助客戶(hù)自動(dòng)解決這些繁瑣的事情。以這些契機(jī),未來(lái)可以落地到哪些場(chǎng)景來(lái)幫助人類(lèi)真正提供有價(jià)值的服務(wù)?其中很重要的一點(diǎn),要解決人與人溝通、交互的問(wèn)題,它靠的是語(yǔ)言,所以我們必須要把人類(lèi)的語(yǔ)言懂透、摸透,通過(guò)計(jì)算機(jī)語(yǔ)言,把語(yǔ)言變成一個(gè)可計(jì)算的東西。這門(mén)學(xué)科非常窄,但卻是最高深的一個(gè)學(xué)科,因?yàn)樗坏私馊说男睦恚要了解語(yǔ)言學(xué),還要了解人機(jī)交互,三門(mén)非常重要的技術(shù)學(xué)科,了解這三項(xiàng)之后,你才能夠真的稱(chēng)得上能夠懂計(jì)算機(jī)語(yǔ)言。我們講情感計(jì)算模型,就是建立在心理學(xué)交互的模型上,需要把語(yǔ)言學(xué)和情緒情感融入到最先進(jìn)的人工智能,才能稱(chēng)得上是懂交互的。交互不僅是觸屏這么簡(jiǎn)單,語(yǔ)音的交互只是一個(gè)感官的交互,眼睛看到圖像也是感官的交互,圖片并不會(huì)跟你對(duì)話(huà)。真正的交互應(yīng)該是相互的過(guò)程,是動(dòng)態(tài)的。人類(lèi)的大腦里面在想的,當(dāng)他講一句話(huà)的時(shí)候,他的context是什么?他的情緒是什么?這是非常重要的,所以需要把計(jì)算機(jī)語(yǔ)言、自然語(yǔ)言處理跟心理學(xué)融合在一起,才有辦法達(dá)到真正的交互。這條路需要非常多的努力。
  NLP未來(lái)關(guān)鍵技術(shù)點(diǎn)
  單從NLP的角度來(lái)看,那么自然語(yǔ)言處理的技術(shù)難點(diǎn)有哪些?這是竹間做了5年,我個(gè)人做了20多年來(lái)的總結(jié)的一些經(jīng)驗(yàn),以前還有很多技術(shù)難點(diǎn),我們?cè)谝灰豢朔,隨著技術(shù)不斷發(fā)展又會(huì)有新增的技術(shù)難點(diǎn),當(dāng)然也越來(lái)越有挑戰(zhàn)性,并且越來(lái)越有價(jià)值。第一點(diǎn),少樣本零樣本的學(xué)習(xí)。這是目前這兩三年來(lái)預(yù)訓(xùn)練模型的崛起,讓大家能夠開(kāi)始去思考的問(wèn)題,能不能用更少量的樣本和數(shù)據(jù)進(jìn)行訓(xùn)練達(dá)到預(yù)訓(xùn)練,未來(lái)能讓語(yǔ)言模型更通用。所以這是一個(gè)挑戰(zhàn)方向,待大家共同努力減少學(xué)習(xí)樣本,讓模型交互的模型更豐富,能夠更快的去完成訓(xùn)練。第二點(diǎn),預(yù)訓(xùn)練模型的壓縮。當(dāng)然大家知道預(yù)訓(xùn)練模型它需要的dimension非常廣,需要的數(shù)據(jù)就非常多,搭建出的模型也非常大,如何盡量壓縮,如何能夠超越Bert,做到比Bert更小,訓(xùn)練速度更快,所需樣本更少?這樣的一個(gè)模型,是要靠大家融入各個(gè)方面的經(jīng)驗(yàn)進(jìn)行優(yōu)化迭代。
  第三點(diǎn),是很重要的一點(diǎn),即自然語(yǔ)言處理是在處理人的語(yǔ)言,缺少了知識(shí),認(rèn)知,包括常識(shí)。以前做詞向量,做句向量,把詞變成一個(gè)向量,用向量來(lái)計(jì)算,這里面是缺少知識(shí)和常識(shí),更沒(méi)有上下文的分析。現(xiàn)在的技術(shù)中慢慢開(kāi)始加入上下文的解析,但僅憑上下文還是沒(méi)有邏輯性的,缺少了知識(shí)和常識(shí)的NLP,沒(méi)有認(rèn)知交互在,就沒(méi)有辦法達(dá)到有意義的交互。那么很重要的一點(diǎn),竹間的核心就是做多模態(tài),多模態(tài)的計(jì)算,要把情緒再加入交互,把語(yǔ)音、語(yǔ)義、圖像,人的眼睛能看的,耳朵能聽(tīng)的,腦袋能思考的,嘴巴可以說(shuō)的都融合起來(lái)做多模態(tài)的交互。有些時(shí)候不需要語(yǔ)言,用眼睛交互,有些時(shí)候不需要語(yǔ)言,用表情交互,喜怒哀樂(lè)用在各個(gè)不一樣的場(chǎng)景,有些時(shí)候通過(guò)聲音的相應(yīng)的語(yǔ)調(diào)識(shí)別情緒,當(dāng)然情緒識(shí)別不僅僅是識(shí)別語(yǔ)調(diào)聲音,所以需要把這些融合成為多模態(tài),這是最困難的部分,也是我們最終要達(dá)到的目的。能夠仿真人能夠達(dá)到多模態(tài)的交互,加上有認(rèn)知的交互,加上有情感的交互,才是我們做人機(jī)交互的最終的一個(gè)目標(biāo)。今天大家在做的詞向量也好,Bert也好,語(yǔ)義的理解都是一個(gè)步驟,要達(dá)到一個(gè)多模態(tài)不能做完語(yǔ)義理解再去做,一定要同時(shí)間結(jié)合整個(gè)文化發(fā)展、經(jīng)濟(jì)發(fā)展、人類(lèi)歷史發(fā)展的腳步去學(xué)習(xí),是一個(gè)累積的過(guò)程。自然語(yǔ)言生成是非常重要的,人的語(yǔ)言是有邏輯性的,不是深度學(xué)習(xí)模型不可控的去隨便生成一句話(huà),也不是靠大量互聯(lián)網(wǎng)的語(yǔ)料撈一個(gè)句子來(lái)進(jìn)行對(duì)話(huà),否則就會(huì)沒(méi)有邏輯可言。所以能不能生成自然語(yǔ)言,需要進(jìn)行有邏輯性的交互。當(dāng)然你有可能在進(jìn)行閑聊,閑聊就沒(méi)有邏輯性,是情感性,情感也是一種邏輯,人類(lèi)rational、emotion,這兩項(xiàng)都加入到自然語(yǔ)言生成NLG的部分,那么這樣的自然語(yǔ)言的生成才是能夠達(dá)到完整的人機(jī)對(duì)話(huà)。很重要的一點(diǎn),知識(shí)的發(fā)現(xiàn)跟推理在交互里面是非常重要的。交互里如何去Auto discover一個(gè)knowledge,新的實(shí)體,新的知識(shí),在這個(gè)知識(shí)上進(jìn)行交互,這個(gè)叫contextual,也就是上下文如何去識(shí)別如何去提取。需要理解,實(shí)體的自然發(fā)現(xiàn),知識(shí)的自動(dòng)發(fā)現(xiàn),累積起來(lái),才能夠解決上下文的問(wèn)題。上下文不是只有指代消解,更重要的是知識(shí),知識(shí)可能有多個(gè)實(shí)體多個(gè)屬性在里面,對(duì)話(huà)里的上下文它還要解決自動(dòng)去發(fā)現(xiàn)知識(shí),自動(dòng)去發(fā)現(xiàn)對(duì)話(huà)里的信息,達(dá)到順暢的上下文的交互,自然就形成了所謂的多輪交互。所以現(xiàn)在的對(duì)話(huà)交互是基于認(rèn)知AI、情感AI,基于雙向的交互性AI,需要達(dá)到contextual上下文各個(gè)信息的理解,才能進(jìn)行Compose text,這叫做Goal-oriented dialogue,Goal-oriented conversation。每一個(gè)gonversation還是一個(gè)goal,所有要解決的一個(gè)交互都是要解決一個(gè)goal,可能當(dāng)中需要完成多個(gè)goal才能達(dá)到一個(gè)交互。
  所以除此之外很重要的一點(diǎn),在深度學(xué)習(xí)里會(huì)碰到的一個(gè)問(wèn)題就是模型越復(fù)雜,越不可控,也可以說(shuō)超出了可控范圍。通過(guò)什么方式能保證人工智能技術(shù)交互技術(shù)是可控的呢?需要做到一點(diǎn),在交互的時(shí)候得到的信息,識(shí)別到的知識(shí)等所有的實(shí)體都是可解釋的。機(jī)器從哪里學(xué)來(lái)的?怎么學(xué)的,學(xué)到了什么?可解釋?zhuān)趴煽。Humanity for AI最終要保護(hù)人類(lèi),不是傷害人類(lèi)。It is to help human to live better,所以很重要的一點(diǎn),機(jī)器學(xué)習(xí)的數(shù)據(jù)、語(yǔ)料、文本、圖像是不是都是可解釋的。
  那么接下來(lái)我探討語(yǔ)義解析的難點(diǎn)怎么樣去解決。很重要的一點(diǎn)就是場(chǎng)景,有了場(chǎng)景我們才能夠把自然語(yǔ)言處理進(jìn)行應(yīng)用去發(fā)揮價(jià)值,在運(yùn)用到場(chǎng)景里也產(chǎn)生更多的數(shù)據(jù)反哺。那么如何去實(shí)踐復(fù)雜的場(chǎng)景?比如:逾期的提醒、快遞的寄送、問(wèn)卷的回訪,我們自己做過(guò)幾百個(gè)不同的場(chǎng)景,每一個(gè)場(chǎng)景,要分析各個(gè)不同層面的技術(shù)來(lái)解決。那么類(lèi)腦的語(yǔ)言的解析層,人的大腦有超過(guò)十幾億的神經(jīng)元agent,每一個(gè)agent都代表一個(gè)工作,如何去拆分成最小的單位去解析,然后理解。包括上下文的理解、知識(shí)的推理、指代消解等非常多,數(shù)十個(gè)不同的小的components去解決。那么還有底層的算法,包括internet、分詞、詞性、NER、關(guān)鍵詞、依存句法分析、語(yǔ)義句法分析、語(yǔ)義角色標(biāo)注的部分等等,數(shù)十個(gè)語(yǔ)言學(xué)的模塊,能不能通過(guò)AI去完完全全,一個(gè)一個(gè)的用最新的機(jī)器學(xué)習(xí)跟深度學(xué)習(xí)的方法構(gòu)建出來(lái),綜合語(yǔ)言學(xué)的部分,這是語(yǔ)義解析的一個(gè)難點(diǎn)。舉個(gè)簡(jiǎn)單的例子,“購(gòu)票成功,但是不出票怎么辦?”這句話(huà)的意圖很簡(jiǎn)單:我想要知道我的票已經(jīng)買(mǎi)了,但是不出票,這需要怎么解決?但是如果中間有一點(diǎn)不同,比如說(shuō):“我購(gòu)票成功,但是取不出票怎么辦?”不出票跟取不出票差一個(gè)字差別卻很大,取不出整體是一個(gè)動(dòng)詞,不是取/不出,中文的部分沒(méi)有空格,所以需要解決很重要的一個(gè)分詞的問(wèn)題。一般市面上的分詞工具基本都解決不了這個(gè)問(wèn)題,無(wú)法分辨“不出票”和“取不出票”。那這樣的問(wèn)題需要如何解決?累積非常多的行業(yè)數(shù)據(jù),還要跨行業(yè)地去解決,所以要有眾多的數(shù)據(jù)跟眾多的模型搭建,才能在一個(gè)語(yǔ)音引擎里讓解析變得更通用,碰到這樣的問(wèn)題才能理解說(shuō)話(huà)者真正的語(yǔ)意是什么。其實(shí)這個(gè)是非常難攻克的一個(gè)問(wèn)題,竹間現(xiàn)在已經(jīng)攻克了。
  舉個(gè)例子:上海話(huà)中“我不要太喜歡你這雙鞋子”一般的分詞或者是翻譯器都會(huì)翻譯成I don't like this shoe too much。但這句話(huà)的正確含義其實(shí)是:我太喜歡這雙鞋子了,這就是為什么無(wú)法理解語(yǔ)言的真正含義進(jìn)行翻譯,這樣的語(yǔ)料沒(méi)有辦法產(chǎn)生一個(gè)非常精確的可解釋的路徑。
  還有一點(diǎn)是,如何加入認(rèn)知的部分,加入人類(lèi)知識(shí)、計(jì)算的部分?我們的人腦是可以進(jìn)行邏輯計(jì)算的,我一個(gè)月用1萬(wàn)塊,那么一年就會(huì)用12萬(wàn)。但是目前一般的語(yǔ)義對(duì)話(huà)聊天機(jī)器是完成不了計(jì)算的,如何把實(shí)體數(shù)字與常識(shí)知識(shí)融合在一起,讓整個(gè)引擎可以進(jìn)行計(jì)算?舉一個(gè)例子,申請(qǐng)信用卡、申請(qǐng)貸款,或者是申請(qǐng)保險(xiǎn)時(shí),那么保險(xiǎn)公司或者貸款公司,會(huì)需要進(jìn)行風(fēng)險(xiǎn)評(píng)估,對(duì)收入進(jìn)行詢(xún)問(wèn),如果你回答了:我月薪2萬(wàn),我老婆是個(gè)課程顧問(wèn),一年收入也在20萬(wàn)左右。那么到底你們家收入是多少?一般的分詞分不出來(lái)的,因?yàn)檫@里面有什么呢?首先涉及多類(lèi)型的NER的抽取,一個(gè)月2萬(wàn),還有一年20多萬(wàn),能不能去解析這20多萬(wàn)是年薪,2萬(wàn)是月薪?再進(jìn)行總和,這就是機(jī)器模型要去完成的。那句話(huà)中還包含這樣一個(gè)信息“我老婆是課程顧問(wèn)”。所以那句話(huà)中包含兩個(gè)實(shí)體,“我”跟“我老婆”中間還有relation,當(dāng)然relationship是配偶關(guān)系,能不能把這個(gè)信息頁(yè)也抽取出來(lái),就可以構(gòu)建有知識(shí)的influence,再加上computation可以計(jì)算出家庭年收入是2萬(wàn)×12+20萬(wàn)=44萬(wàn)。得出的結(jié)果再傳到風(fēng)控系統(tǒng)中進(jìn)行評(píng)估,評(píng)估結(jié)果再通過(guò)機(jī)器人傳達(dá)給客戶(hù)。這個(gè)叫做人機(jī)對(duì)話(huà),接入企業(yè)的內(nèi)部的計(jì)算系統(tǒng),達(dá)到一個(gè)complish一個(gè)test一個(gè)goal,這是最經(jīng)典的一個(gè)例子,看似簡(jiǎn)單其實(shí)非常難實(shí)現(xiàn)。這不僅僅是一個(gè)閑聊機(jī)器人或者一個(gè)語(yǔ)音助手,需要具有認(rèn)知、常識(shí)、計(jì)算、語(yǔ)言學(xué),通過(guò)整個(gè)contextual理解,才能獲取即使只有3個(gè)字亦或30個(gè)字里的真實(shí)信息和意圖。如何把對(duì)話(huà)信息都準(zhǔn)確抽取,就是現(xiàn)在需要完成的最重要的工作,而竹間現(xiàn)在已經(jīng)能達(dá)成不錯(cuò)的效果,未來(lái)還會(huì)繼續(xù)努力去突破更多更難的語(yǔ)義問(wèn)題。
  語(yǔ)義解析中還有一個(gè)難點(diǎn),舉個(gè)簡(jiǎn)單易懂的例子:“開(kāi)通手機(jī)銀行就能繳燃?xì)赓M(fèi)嗎?怎么開(kāi)通?怎么繳?”這樣一個(gè)問(wèn)句中“開(kāi)通手機(jī)銀行能交燃?xì)赓M(fèi)嗎”這是一個(gè)常用問(wèn)答——Frequently Asked Questions即FAQ,但是句子中緊接著“怎么開(kāi)通?怎么繳?”包含兩個(gè)意圖:第一,怎么去開(kāi)通手機(jī)銀行;第二,怎么去繳燃?xì)赓M(fèi)?所以在這個(gè)句子中包含一個(gè)常用問(wèn)答和兩個(gè)意圖。所以機(jī)器人需要解決三件事情,首先要去提取關(guān)鍵信息,手機(jī)銀行是一個(gè)關(guān)鍵信息,燃?xì)赓M(fèi)是一個(gè)關(guān)鍵信息,開(kāi)通繳費(fèi)是一個(gè)關(guān)鍵信息,通過(guò)組合后,進(jìn)行多意圖解析,再根據(jù)事件邏輯跟后臺(tái)系統(tǒng)對(duì)接,并進(jìn)行回答,還可以通過(guò)推薦問(wèn)進(jìn)行引導(dǎo),與用戶(hù)連續(xù)對(duì)話(huà)進(jìn)而解決用戶(hù)的問(wèn)題,這樣就可以形成一個(gè)完美豐富的服務(wù)閉環(huán)。所以多意圖多實(shí)體,信息抽取這一門(mén)學(xué)科已經(jīng)發(fā)展了幾十年,直到現(xiàn)在我們還在繼續(xù)優(yōu)化它。Information mining、Information retrieval這些傳統(tǒng)的文本分析、文本處理的技術(shù),竹間今天用人工智能來(lái)實(shí)現(xiàn)。
  竹間智能646戰(zhàn)略
  最后向大家介紹一下竹間的三大支柱——“646戰(zhàn)略”。包含竹間的6大的核心技術(shù),這是我們一直在聚焦的方向;4大核心產(chǎn)品平臺(tái),是5年來(lái)打磨的成果,它既是一個(gè)平臺(tái),也是一個(gè)產(chǎn)品;在6大行業(yè)里,竹間已經(jīng)建立跨行業(yè)領(lǐng)域的合作。
  6大技術(shù)方向包含自然語(yǔ)言處理、知識(shí)工程、深度學(xué)習(xí)&AutoML、文本數(shù)據(jù)中臺(tái)、視覺(jué)計(jì)算、語(yǔ)音識(shí)別,集成在竹間的Bot Factory™平臺(tái)。竹間所有內(nèi)部開(kāi)發(fā)和客戶(hù)定制開(kāi)發(fā)都是基于自動(dòng)化的機(jī)器學(xué)習(xí)平臺(tái)上進(jìn)行的,包含F(xiàn)inetuning,Pre-train等各式各樣不同的模塊,才能夠做到零代碼開(kāi)發(fā)。二次開(kāi)發(fā),客戶(hù)也可以使用自己開(kāi)發(fā)好的模型代替我們自建的模型,所以整個(gè)Bot Factory™它是一個(gè)非常強(qiáng)大的模塊、引擎,當(dāng)然也包含了龐大的NLP的技術(shù)模塊在里面。而文本數(shù)據(jù)中臺(tái)是解決企業(yè)里長(zhǎng)文本分析應(yīng)用,視覺(jué)計(jì)算也是竹間累積近5年的人臉的表情,情緒情感識(shí)別技術(shù),像口罩識(shí)別、活體識(shí)別等應(yīng)用。語(yǔ)音辨識(shí)是竹間除了語(yǔ)義之外非常擅長(zhǎng)的部分,現(xiàn)在竹間的ASR和TTS技術(shù)已經(jīng)向科大訊飛、阿里看齊。竹間把語(yǔ)音和語(yǔ)義技術(shù)結(jié)合,形成全雙工全場(chǎng)景AICC解決方案。
  那么由這6個(gè)技術(shù),我們?cè)谶@幾年來(lái)的沉淀出來(lái)4個(gè)平臺(tái),Bot Factory™的平臺(tái),能夠零代碼一鍵部署,能夠讓用戶(hù)不用寫(xiě)代碼,就可以創(chuàng)建機(jī)器人。在某些跨行業(yè)領(lǐng)域里,竹間的機(jī)器人已經(jīng)可以達(dá)到零啟動(dòng)的水平,也就是不需要訓(xùn)練,準(zhǔn)確率可以達(dá)到80%以上,那么再加上后期的語(yǔ)料訓(xùn)練和實(shí)際的運(yùn)行準(zhǔn)確率可以提升至95%甚至于97%。
  AICC是竹間的AI Contact Center TotalSolution,賦能于企業(yè)的Callcenter,比如說(shuō)跟竹間合作的Avaya,我們把AI技術(shù)放到Callcenter里去,現(xiàn)在竹間在Callcenter里有八大不同的產(chǎn)品,AICC的產(chǎn)品包括智能客服,AI質(zhì)檢,輔助坐席,陪練機(jī)器人,培訓(xùn),用戶(hù)畫(huà)像分析,還有營(yíng)銷(xiāo)的分析,整個(gè)形成AICC的全方位解決方案,那么把語(yǔ)音跟語(yǔ)義再融合,我們是一個(gè)全場(chǎng)景的AICC解決方案,再加上我們的語(yǔ)音、語(yǔ)義、圖像的Total Solution,那么企業(yè)就不需要再找另外不同的AI廠商再去做非常復(fù)雜的集成了,這就是竹間能夠提供一個(gè)什么?一站式的企業(yè)級(jí)的人工智能平臺(tái),這個(gè)平臺(tái)里面是由4個(gè)平臺(tái)組成的。
  還有NLP的平臺(tái),它不僅僅是NLP的API,它更是一個(gè)NLP的Operatingsystem,企業(yè)客戶(hù)及端客戶(hù)需要做NLP二次開(kāi)發(fā)的,可以部署這套系統(tǒng),這套系統(tǒng)能夠讓企業(yè)去進(jìn)行數(shù)據(jù)處理、訓(xùn)練、運(yùn)維、測(cè)試跟上線(xiàn),NLP平臺(tái)的27個(gè)模塊能夠幫助企業(yè)去做比對(duì),完成校稿、審稿等很多業(yè)務(wù)。
  竹間的Gemini平臺(tái),它是一個(gè)更強(qiáng)的認(rèn)知型的平臺(tái),Cognitive engineering的平臺(tái),通過(guò)自動(dòng)化來(lái)構(gòu)建知識(shí)圖譜,擁有龐大的語(yǔ)義解析能力,有OCR能力,有image的能力,能夠去解析非結(jié)構(gòu)化數(shù)據(jù),它有一個(gè)自動(dòng)處理的pipeline,能夠做屬性的自動(dòng)挖掘,實(shí)體的自動(dòng)挖掘,模型的Finetuning,能夠自動(dòng)發(fā)現(xiàn)實(shí)體跟屬性,構(gòu)建知識(shí)圖譜。那么它不僅僅是構(gòu)建知識(shí)圖譜,它是一套整套的技術(shù)平臺(tái),也就是說(shuō)整套的技術(shù)平臺(tái)可以license給到企業(yè),讓他們用這個(gè)技術(shù)平臺(tái)去自動(dòng)構(gòu)建知識(shí)圖譜,而不需要用人工去構(gòu)建知識(shí)圖譜。現(xiàn)在傳統(tǒng)的知識(shí)圖譜的一些廠商,他們是以人工通過(guò)一個(gè)個(gè)的實(shí)體連接創(chuàng)建知識(shí)圖譜,這不屬于自動(dòng)化。而竹間的Gemini是可以通過(guò)自動(dòng)化創(chuàng)建知識(shí)圖譜,它可以通過(guò)解析100萬(wàn)個(gè)的文檔,200萬(wàn)個(gè)文檔構(gòu)建一個(gè)知識(shí)圖譜,也可以給它預(yù)先定義的詞庫(kù),預(yù)先定義的knowledge,它也會(huì)自動(dòng)Auto discovery,發(fā)現(xiàn)屬性發(fā)現(xiàn)實(shí)體,那么可以形成一個(gè)人機(jī)交互,它做不出來(lái)東西再進(jìn)行人工干預(yù),所以它是一個(gè)自動(dòng)化,構(gòu)建知識(shí)圖譜的工程,也有inference的引擎在里面,還有一個(gè)很強(qiáng)大的process引擎在里面,可以處理所有流程自動(dòng)化的問(wèn)題。
  這4大產(chǎn)品平臺(tái)是我們累積6個(gè)技術(shù)在6個(gè)行業(yè)里過(guò)去5年內(nèi)沉淀下來(lái),包括金融行業(yè),智能終端行業(yè),像智能手機(jī),包括傳統(tǒng)行業(yè)、互聯(lián)網(wǎng)行業(yè)、醫(yī)藥醫(yī)療,還有教育行業(yè)6大行業(yè),比如說(shuō)銀行類(lèi)的,有北京銀行、建設(shè)銀行等等,還有AIoT華為、OPPO,還有優(yōu)必選、科沃斯,央企的客戶(hù)有華潤(rùn)、招商局輪船、中廣核等等,竹間幫他們落地了很多不用場(chǎng)景,有幾十個(gè)不同的應(yīng)用。那么這些年來(lái)我們也非常感謝能夠跟數(shù)百個(gè)標(biāo)桿企業(yè),包括很多這些行業(yè)里面數(shù)一數(shù)二的大型企業(yè)。今年在整個(gè)疫情爆發(fā)之后,更多的企業(yè)用戶(hù)已經(jīng)開(kāi)始要采用NLP的這些場(chǎng)景了,所以NLP的產(chǎn)業(yè)是在復(fù)蘇。我相信NLP會(huì)是比視覺(jué)產(chǎn)業(yè)跟語(yǔ)音產(chǎn)業(yè)大上上百倍甚至于上千倍的一個(gè)產(chǎn)業(yè),在未來(lái)的十年二十年里,它會(huì)是人類(lèi)交互的一個(gè)operatingsystem的主要核心技術(shù)。
 
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

評(píng)論排行

專(zhuān)題

CTI論壇會(huì)員企業(yè)

常熟市| 渝北区| 黄冈市| 阳城县| 巍山| 囊谦县| 团风县| 隆安县| 安泽县| 阜城县| 沅江市| 周至县| 平顺县| 曲麻莱县| 青川县| 金堂县| 乐安县| 夏津县| 荥经县| 玉溪市| 澄城县| 汤原县| 天水市| 读书| 广河县| 会东县| 霍州市| 瓦房店市| 桐柏县| 木兰县| 开远市| 五莲县| 河池市| 湘潭县| 张家川| 酒泉市| 平果县| 固镇县| 道真| 新沂市| 西平县|