亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

您當(dāng)前的位置是:  首頁(yè) > 資訊 > 文章精選 >
 首頁(yè) > 資訊 > 文章精選 >

深度 | AI 建模實(shí)際應(yīng)用場(chǎng)景及效益

2020-04-23 09:30:03   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  隨著AI科技的發(fā)展,過(guò)去很多無(wú)法應(yīng)用計(jì)算機(jī)算法分析的場(chǎng)景現(xiàn)在已經(jīng)成為可能,并且能經(jīng)由AI的算法帶來(lái)實(shí)際的業(yè)務(wù)效益,提升營(yíng)收。本文將以普強(qiáng)的AI建模、語(yǔ)義理解、語(yǔ)音識(shí)別等相關(guān)技術(shù)為核心所建立的一套優(yōu)化商業(yè)場(chǎng)景機(jī)制,在行業(yè)中的實(shí)際應(yīng)用所產(chǎn)生的效益做詳細(xì)闡述。
  國(guó)內(nèi)一名列世界500強(qiáng)的保險(xiǎn)公司(以下簡(jiǎn)稱(chēng)“A保險(xiǎn)公司”),擁有龐大的電銷(xiāo)團(tuán)隊(duì),雇傭了上萬(wàn)名電銷(xiāo)人員,每月電銷(xiāo)電話(huà)撥打量達(dá)到千萬(wàn)通。由于客戶(hù)名單基本為白名單,即沒(méi)有客戶(hù)的信息,傳統(tǒng)的格式化維度分析無(wú)法應(yīng)用,所以A保險(xiǎn)公司在沒(méi)有客戶(hù)信息的情況下,實(shí)行全量撥打,這樣的撥打效果成交率在千分之一以下。另一方面,全量撥打的電銷(xiāo)電話(huà)也給客戶(hù)帶來(lái)不良的印象,對(duì)客戶(hù)造成不必要的干擾。近年來(lái),監(jiān)管力度逐年上升,對(duì)電銷(xiāo)電話(huà)管控嚴(yán)度加大。為能有效運(yùn)營(yíng)電銷(xiāo)就需要有特定對(duì)象,向有購(gòu)買(mǎi)保險(xiǎn)意愿的客戶(hù)精準(zhǔn)的撥打。
 
  隨著AI科技的進(jìn)步,普強(qiáng)AI建模產(chǎn)品的核心運(yùn)用了最新的AI語(yǔ)音轉(zhuǎn)譯和語(yǔ)義理解技術(shù),為這樣的場(chǎng)景提供了一個(gè)極佳的解決方案,能夠讓A保險(xiǎn)公司和有類(lèi)似業(yè)務(wù)場(chǎng)景公司的電銷(xiāo)人員將資源集中在有潛在購(gòu)買(mǎi)意愿的客戶(hù)。一方面,避免撥打全量的電話(huà),減少人力資源和電信話(huà)費(fèi),另一方面,能有效減少對(duì)沒(méi)有購(gòu)買(mǎi)意愿客戶(hù)的干擾。當(dāng)客戶(hù)有意愿和需求購(gòu)買(mǎi)保險(xiǎn)時(shí),電銷(xiāo)的外呼電話(huà)不被認(rèn)為是干擾;相反,對(duì)沒(méi)有購(gòu)買(mǎi)意愿或能力的人,這樣的電話(huà)即成為客戶(hù)的干擾。
  事實(shí)上,經(jīng)過(guò)AI建模的分析,在數(shù)百萬(wàn)的客戶(hù)名單中,有購(gòu)買(mǎi)意愿的大約在15%左右,因此80%以上的電話(huà)都是不必要撥打的。這樣的應(yīng)用給A保險(xiǎn)公司和有類(lèi)似應(yīng)用場(chǎng)景的公司省下巨大的成本。接下來(lái),將會(huì)對(duì)此做詳盡的描述。
  1、語(yǔ)音語(yǔ)義理解可獲取有價(jià)值的客戶(hù)特征
  雖然沒(méi)有客戶(hù)的固定維度信息,但是有許多已撥打過(guò)的錄音,A保險(xiǎn)公司擁有海量的客戶(hù)通話(huà)錄音,錄音內(nèi)含有寶貴的客戶(hù)信息、客戶(hù)特征等。這些數(shù)據(jù)都可以作為篩選客戶(hù)的依據(jù),例如在電銷(xiāo)的過(guò)程中可以得知:
  買(mǎi)過(guò)保險(xiǎn):“謝謝,我已經(jīng)有保險(xiǎn)了”。
  可能有車(chē):“對(duì)不起,我正在開(kāi)車(chē),不方便講話(huà)”。
  有房人士:“我目前房貸壓力大,沒(méi)有閑錢(qián)買(mǎi)保險(xiǎn)”。
  還有許多類(lèi)似的特征都可以從電銷(xiāo)人員和客戶(hù)的通話(huà)中獲取,做成客戶(hù)畫(huà)像。普強(qiáng)過(guò)去積累了許多成功案例,其中就包含大量這樣有價(jià)值的客戶(hù)特征。從各樣的案例中,電銷(xiāo)人員重點(diǎn)關(guān)注擁有這些特征的客戶(hù),撥打給這類(lèi)有較高意愿的客戶(hù)并提高銷(xiāo)售力度,增加撥打次數(shù)和跟進(jìn),從而提升銷(xiāo)售成交率。因此,若能將這些寶貴的客戶(hù)信息特征挖掘出來(lái),也就能更進(jìn)一步找出潛在客戶(hù),從而將電銷(xiāo)團(tuán)隊(duì)的大量資源(人力、時(shí)間、電話(huà)費(fèi)用……)做最有效的運(yùn)用,達(dá)到最大收益。
  2、AI語(yǔ)音轉(zhuǎn)譯和語(yǔ)義理解
  自從2010年蘋(píng)果電腦、手機(jī)發(fā)布Siri應(yīng)用后,語(yǔ)音識(shí)別技術(shù)不斷的更新、突破。其主要是源于一種計(jì)算機(jī)算法架構(gòu)的技術(shù)突破:深度神經(jīng)網(wǎng)絡(luò)。使用神經(jīng)網(wǎng)絡(luò)的技術(shù),研究人員不斷推進(jìn)許多人工智能以前不能突破的障礙,例如語(yǔ)音識(shí)別、圖像識(shí)別、語(yǔ)義理解等三大領(lǐng)域。借助神經(jīng)網(wǎng)絡(luò)架構(gòu),這些領(lǐng)域里的問(wèn)題都大大提升了應(yīng)用上的效果。這樣的突破主要由以下幾個(gè)因素造成:
  • 數(shù)據(jù)量的徒增:借著互聯(lián)網(wǎng)的發(fā)展,大量的用戶(hù)將語(yǔ)音、圖像、照片、文字上傳到大型的數(shù)據(jù)中心。
  • 大型云計(jì)算中心超級(jí)的運(yùn)算能力:能儲(chǔ)存、處理、分析這些海量的數(shù)據(jù)。
  • 算法的突破:借助前兩項(xiàng),算法得以不斷的被驗(yàn)證、優(yōu)化、迭代更新,創(chuàng)新的神經(jīng)網(wǎng)絡(luò)架構(gòu)不斷的被提出并被驗(yàn)證。
  在語(yǔ)音識(shí)別方面,2017年微軟研究院的技術(shù)達(dá)到了與人翻譯的結(jié)果相同的里程碑。在電話(huà)對(duì)話(huà)的數(shù)據(jù)集(Switchboard),微軟的研究員們使用了多個(gè)神經(jīng)網(wǎng)絡(luò)模型來(lái)翻譯使結(jié)果達(dá)到最優(yōu),翻譯的字錯(cuò)誤率與4位專(zhuān)業(yè)翻譯人士共同翻譯的錯(cuò)誤率基本相同。2018年谷歌的DeepMind使用了大型的CNN-RNN-CTC神經(jīng)網(wǎng)絡(luò)架構(gòu),翻譯結(jié)果比翻譯專(zhuān)家好六倍。同時(shí)在圖像識(shí)別方面,也同樣有重大突破,使得自動(dòng)駕駛這樣復(fù)雜的工作,變得可實(shí)現(xiàn)。
  語(yǔ)音、圖像識(shí)別持續(xù)突破,在語(yǔ)義理解方面,使用神經(jīng)網(wǎng)絡(luò)架構(gòu)的算法也突破了人的水平。著名的史丹佛大學(xué)語(yǔ)義理解競(jìng)賽的文本問(wèn)答數(shù)據(jù)集,內(nèi)有10萬(wàn)條問(wèn)答,都是從維基百科摘選的文章片段,然后對(duì)每一片段由真人提出問(wèn)題,并在文章片段內(nèi)找出答案的位置。準(zhǔn)確率由2017年前的60%迅速攀升到最新的90%以上,遠(yuǎn)遠(yuǎn)超過(guò)人的水平,人的水平為86.8%,而準(zhǔn)確率最高的神經(jīng)網(wǎng)絡(luò)是94.6%。它所使用的神經(jīng)網(wǎng)絡(luò)架構(gòu)為一種稱(chēng)為T(mén)ransformer的網(wǎng)絡(luò),疊加24次,形成一個(gè)深度大型的網(wǎng)絡(luò)(BERT),并使用了兆級(jí)數(shù)量的詞匯做訓(xùn)練。在其它常用的語(yǔ)義任務(wù)上,神經(jīng)網(wǎng)絡(luò)也都極大的提升了準(zhǔn)確率,例如命名實(shí)體識(shí)別(NER)、關(guān)系識(shí)別、文本蘊(yùn)含(textentailment)等。
  這些人工智能的科技突破,讓許多以往計(jì)算機(jī)不能應(yīng)用到的場(chǎng)景成為新的應(yīng)用。在語(yǔ)音方面,企業(yè)存儲(chǔ)的海量錄音,以往是黑盒子,無(wú)法進(jìn)行分析整理。不像結(jié)構(gòu)化的數(shù)據(jù),使用大型的數(shù)據(jù)庫(kù),可以做查詢(xún)、統(tǒng)計(jì)、分析、圖表化等工作。如今,可以經(jīng)由語(yǔ)音識(shí)別成為文字,然后再經(jīng)由語(yǔ)義理解做分析,產(chǎn)生實(shí)際的應(yīng)用效益。接下來(lái)將對(duì)最新的語(yǔ)音、語(yǔ)義技術(shù)在人工智能科技的應(yīng)用作案例分析。
  3、語(yǔ)音語(yǔ)義分析現(xiàn)行科技狀況
  語(yǔ)音識(shí)別相對(duì)比較容易理解和定義,其任務(wù)就是將聲音轉(zhuǎn)成文字,而轉(zhuǎn)化的效果可以簡(jiǎn)易的用字錯(cuò)誤率來(lái)界定。但是識(shí)別的準(zhǔn)確率與諸多因素相關(guān),可以用人的體驗(yàn)來(lái)做比喻,因?yàn)槿斯ぶ悄芑揪褪悄7氯说闹悄埽?/div>
  • 專(zhuān)業(yè)領(lǐng)域:如果在一個(gè)不同的專(zhuān)業(yè)領(lǐng)域,例如醫(yī)學(xué),許多的用語(yǔ)不是一般常用的,一個(gè)非醫(yī)學(xué)專(zhuān)業(yè)的人士不容易理解這些醫(yī)學(xué)的用語(yǔ),做文字轉(zhuǎn)化的也會(huì)出錯(cuò)。
  • 口音/方言:嚴(yán)重的方言口音或是方言。
  • 傳播媒介:如電話(huà)信道。
  • 背景聲音:如吵雜的環(huán)境。
  這些都會(huì)影響識(shí)別的結(jié)果,就像人需要時(shí)間適應(yīng)后才能聽(tīng)懂一個(gè)新環(huán)境里的對(duì)話(huà)交流。所以要降低語(yǔ)音轉(zhuǎn)譯的錯(cuò)誤率,必須要能對(duì)專(zhuān)業(yè)或應(yīng)用領(lǐng)域有足夠的認(rèn)識(shí),熟悉地域的口音、方言等。
  普強(qiáng)的語(yǔ)音轉(zhuǎn)譯專(zhuān)注于固定領(lǐng)域來(lái)積累領(lǐng)域的專(zhuān)業(yè)話(huà)語(yǔ),也同時(shí)積累了大量的語(yǔ)音覆蓋了口音、方言、傳播媒介特性、背景聲音等因素,來(lái)優(yōu)化語(yǔ)音轉(zhuǎn)譯的正確率。
  另一方面,語(yǔ)義理解任務(wù)相對(duì)的就比較不容易定義和理解,有一組學(xué)術(shù)界定義的語(yǔ)義理解相關(guān)的問(wèn)題(GLUE):
  • CoLA:?jiǎn)尉涞亩诸?lèi)問(wèn)題,判斷一個(gè)英文句子在語(yǔ)法上是不是可接受的。
  • SST-2:?jiǎn)尉涞亩诸?lèi)問(wèn)題,句子的來(lái)源于人們對(duì)一部電影的評(píng)價(jià),判斷這個(gè)句子的情感。
  • MRPC:句子對(duì)來(lái)源于對(duì)同一條新聞的評(píng)論,判斷這一對(duì)句子在語(yǔ)義上是否相同。
  • STS-B:這是一個(gè)類(lèi)似回歸的問(wèn)題,給出一對(duì)句子,使用1~5的評(píng)分評(píng)價(jià)兩者在語(yǔ)義上的相似程度。
  • QQP:這是一個(gè)二分類(lèi)數(shù)據(jù)集,目的是判斷兩個(gè)來(lái)自于Quora的問(wèn)題句子在語(yǔ)義上是否是等價(jià)的。
  • MNLI-m:語(yǔ)型內(nèi)匹配。推斷兩個(gè)句子是意思相近,矛盾,還是無(wú)關(guān)的。
  • MNLI-mm:跨語(yǔ)型匹配。推斷兩個(gè)句子是意思相近,矛盾,還是無(wú)關(guān)的。
  • QNLI:也是一個(gè)二分類(lèi)問(wèn)題,兩個(gè)句子是一個(gè)(question,answer)對(duì),正樣本為answer是對(duì)應(yīng)question的答案,負(fù)樣本則相反。
  • RTE:是一個(gè)二分類(lèi)問(wèn)題,類(lèi)似于MNLI,但是數(shù)據(jù)量少很多。
  • WNLI:推斷兩個(gè)句子是意思相近,矛盾,還是無(wú)關(guān)的。
  • AX:QA型圖像數(shù)據(jù)庫(kù)。
  這些任務(wù)都有許多應(yīng)用場(chǎng)景,但是語(yǔ)義理解的應(yīng)用范疇也有很多不能直接應(yīng)用這些任務(wù),例如從一段對(duì)話(huà)文本中來(lái)判斷一個(gè)人是否結(jié)婚,如下面的對(duì)話(huà):
  A:您好,我想跟您談下我們公司最近的一個(gè)產(chǎn)品的活動(dòng),這個(gè)產(chǎn)品能夠......
  B:嗯,謝謝,不過(guò)我需要和我老婆商量商量...。
  明顯的從這段對(duì)話(huà)里,可以判定B是已經(jīng)結(jié)過(guò)婚的人。再例如,服務(wù)業(yè)里常有禁忌的用語(yǔ)如:
  A-先聽(tīng)我說(shuō)or A-是誰(shuí)說(shuō)or A-怎么知道or A-誰(shuí)告訴你or A-有沒(méi)有搞錯(cuò)or A-你弄錯(cuò)了or A-說(shuō)重點(diǎn)or A-你必須or A-本來(lái)應(yīng)該or A-這個(gè)部門(mén)很差勁or A-這個(gè)部門(mén)差勁or A-到底需要不需要or A-你不要跟我喊or A-你明白了嗎or A-那您覺(jué)得呢or A-我說(shuō)的很清楚了or A-剛才不是對(duì)你說(shuō)了
  這樣的語(yǔ)義理解應(yīng)用均不是GLUE里面的任務(wù)能夠直接應(yīng)用的,并且在GLUE里表現(xiàn)良好的神經(jīng)網(wǎng)絡(luò)架構(gòu)也不能保證在真實(shí)應(yīng)用的場(chǎng)景里達(dá)到產(chǎn)生業(yè)務(wù)價(jià)值的效果。
  2018年底,谷歌發(fā)布了一種神經(jīng)網(wǎng)絡(luò)架構(gòu)BERT,一種基于Transformer架構(gòu)的多層疊加的神經(jīng)網(wǎng)絡(luò),BERT提出兩種版本,基本版(BASE)和大型版(LARGE),參數(shù)如下:
  BERTBASE:L=12,H=768,A=12,TotalParameters=110M
  BERTLARGE:L=24,H=1024,A=16,TotalParameters=34
  使用了3.3Giga的詞匯作預(yù)訓(xùn)練,然后再按任務(wù)作微調(diào)訓(xùn)練,硬件使用了谷歌TPUV2.0的處理器,BERT的基礎(chǔ)版(BASE)需要16個(gè)TPU芯片,BERT的LARGE版使用了64個(gè)TPU芯片,預(yù)訓(xùn)練需要4天。
  在GLUE的許多任務(wù)上均優(yōu)于此前的神經(jīng)網(wǎng)絡(luò)架構(gòu)(如上表所列)。BERT在語(yǔ)音識(shí)別和圖像識(shí)別突破后帶來(lái)了語(yǔ)義理解的突破。此后在BERT的基礎(chǔ)上,在語(yǔ)義理解的許多應(yīng)用上都帶來(lái)了突破。然而由于BERT和后續(xù)的神經(jīng)網(wǎng)絡(luò)都需要龐大的計(jì)算資源和時(shí)間,給私有化部署的應(yīng)用帶來(lái)高昂的成本,除非能夠使用云端共享的BERT計(jì)算資源。由于數(shù)據(jù)保密的要求,許多應(yīng)用的數(shù)據(jù)無(wú)法上傳到云端,例如金融業(yè)的客戶(hù)數(shù)據(jù)等。
  如前所述,這樣的科技還需要經(jīng)過(guò)再創(chuàng)新才能應(yīng)用在實(shí)際的商業(yè)場(chǎng)景里。普強(qiáng)在這個(gè)方面做了十年的科研投入,不斷的將最新的科技應(yīng)用在實(shí)際的商業(yè)場(chǎng)景上。
  4、普強(qiáng)語(yǔ)音語(yǔ)義框架
  當(dāng)前人工智能算法均屬在高維度的空間中尋找線性/非線性復(fù)合函數(shù)的最優(yōu)值點(diǎn),其最核心的架構(gòu)設(shè)計(jì)實(shí)為設(shè)計(jì)此高維度空間里的數(shù)學(xué)復(fù)合函數(shù),許多的復(fù)合函數(shù)/神經(jīng)網(wǎng)絡(luò)框架都在不同的任務(wù)中被驗(yàn)證有應(yīng)用的效益,下面列舉了幾個(gè)重要的類(lèi)別:
  全聯(lián)多層的神經(jīng)網(wǎng)絡(luò):每層的神經(jīng)元均與下一層的所有神經(jīng)元相連,邏輯回歸等算法均使用此種網(wǎng)絡(luò)。
  • 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN):是一類(lèi)包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks),是深度學(xué)習(xí)(deeplearning)的代表算法之一。卷積神經(jīng)網(wǎng)絡(luò)具有表征學(xué)習(xí)(representation learning)能力,能夠按其階層結(jié)構(gòu)對(duì)輸入信息進(jìn)行平移不變分類(lèi)(shift-invariant classification),因此也被稱(chēng)為“平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)(Shift-Invariant Artificial Neural Networks,SIANN)。卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)在視覺(jué)辨識(shí)里達(dá)到了極優(yōu)的效果。
  • 循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN):是一類(lèi)以序列(sequence)數(shù)據(jù)為輸入,在序列的演進(jìn)方向進(jìn)行遞歸(recursion)且所有節(jié)點(diǎn)(循環(huán)單元)按鏈?zhǔn)竭B接的遞歸神經(jīng)網(wǎng)絡(luò)(recursiveneuralnetwork)。循環(huán)神經(jīng)網(wǎng)絡(luò)的研究始于二十世紀(jì)80-90年代,并在二十一世紀(jì)初發(fā)展為深度學(xué)習(xí)(deeplearning)算法之一,其中雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(BidirectionalRNN,Bi-RNN)和長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memorynetworks,LSTM)是常見(jiàn)的的循環(huán)神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)具有記憶性、參數(shù)共享并且圖靈完備(Turingcompleteness),因此在對(duì)序列的非線性特征進(jìn)行學(xué)習(xí)時(shí)具有一定優(yōu)勢(shì)。循環(huán)神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理(Natural Language Processing,NLP),例如語(yǔ)音識(shí)別、語(yǔ)言建模、機(jī)器翻譯等領(lǐng)域有應(yīng)用,也被用于各類(lèi)時(shí)間序列預(yù)報(bào)。引入了卷積神經(jīng)網(wǎng)絡(luò)(Convoutional Neural Network,CNN)構(gòu)筑的循環(huán)神經(jīng)網(wǎng)絡(luò)可以處理包含序列輸入的計(jì)算機(jī)視覺(jué)問(wèn)題。
  • Transformer神經(jīng)網(wǎng)絡(luò):拋棄了傳統(tǒng)的CNN和RNN,整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)完全是由Attention機(jī)制組成。更準(zhǔn)確地講,Transformer由且僅由Self-Attenion和FeedForward Neural Network組成。一個(gè)基于Transformer的可訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以通過(guò)堆疊Transformer的形式進(jìn)行搭建,作者的實(shí)驗(yàn)是通過(guò)搭建編碼器和解碼器各6層,總共12層的Encoder-Decoder,并在機(jī)器翻譯中取得了BLEU值得新高。
  • CTC(Connectionis ttemporal classification):傳統(tǒng)的語(yǔ)音識(shí)別的聲學(xué)模型訓(xùn)練,對(duì)于每一幀的數(shù)據(jù),需要知道對(duì)應(yīng)的label才能進(jìn)行有效的訓(xùn)練,在訓(xùn)練數(shù)據(jù)之前需要做語(yǔ)音對(duì)齊的預(yù)處理。而語(yǔ)音對(duì)齊的過(guò)程本身就需要進(jìn)行反復(fù)多次的迭代,來(lái)確保對(duì)齊更準(zhǔn)確,這本身就是一個(gè)比較耗時(shí)的工作。與傳統(tǒng)的聲學(xué)模型訓(xùn)練相比,采用CTC作為損失函數(shù)的聲學(xué)模型訓(xùn)練,是一種完全端到端的聲學(xué)模型訓(xùn)練,不需要預(yù)先對(duì)數(shù)據(jù)做對(duì)齊,只需要一個(gè)輸入序列和一個(gè)輸出序列即可以訓(xùn)練。這樣就不需要對(duì)數(shù)據(jù)對(duì)齊和一一標(biāo)注,并且CTC直接輸出序列預(yù)測(cè)的概率,不需要外部的后處理。
  以上僅就目前人工智能應(yīng)用領(lǐng)域里經(jīng)常使用并產(chǎn)生實(shí)際應(yīng)用效益的網(wǎng)絡(luò)做了簡(jiǎn)介,當(dāng)應(yīng)用到各個(gè)實(shí)際場(chǎng)景里時(shí),還有基于上述網(wǎng)絡(luò)衍生的眾多版本和彼此之間的結(jié)合版,不能一一詳述。
  深度學(xué)習(xí)里的神經(jīng)網(wǎng)絡(luò)架構(gòu)及其參數(shù)和超參數(shù)均需按實(shí)際場(chǎng)景和數(shù)據(jù)的情況作調(diào)試優(yōu)化,方能達(dá)到理想的效果以產(chǎn)生實(shí)際應(yīng)用價(jià)值。然而實(shí)際的場(chǎng)景雖然都有相似之處,但也有諸多不同的細(xì)節(jié),為能滿(mǎn)足每一應(yīng)用場(chǎng)景的應(yīng)用效益要求,以過(guò)往往需要由資深的算法工程師做深度的調(diào)試,此種模式耗時(shí)且效率低,常常不能滿(mǎn)足客戶(hù)快速的迭代需求。
  大型人工智能科技公司提倡將大量的數(shù)據(jù)存儲(chǔ)在它們的云計(jì)算平臺(tái)上,并同時(shí)按采集到的海量數(shù)據(jù)調(diào)試一個(gè)能廣泛應(yīng)用的平臺(tái)。此種商業(yè)模式,雖有可行性,但同時(shí)也面臨著一些根本的挑戰(zhàn)。例如如何能保證數(shù)據(jù)的安全,特別是金融行業(yè)和其它對(duì)數(shù)據(jù)保密要求高的行業(yè),同時(shí)這些大型的人工智能公司現(xiàn)今也不斷的擴(kuò)張他們的業(yè)務(wù)領(lǐng)域,將數(shù)據(jù)提供給此類(lèi)的云平臺(tái),也加速了他們的競(jìng)爭(zhēng)力來(lái)切入不同的商業(yè)領(lǐng)域,這樣的擔(dān)憂(yōu)也是使得這樣的方法無(wú)法獲得更多商業(yè)應(yīng)用的數(shù)據(jù),從而不能提供一個(gè)通用的應(yīng)用人工智能系統(tǒng)。
  據(jù)此普強(qiáng)提出發(fā)展一種可重復(fù)復(fù)用的機(jī)制,將這個(gè)機(jī)制靈活的應(yīng)用到每一個(gè)客戶(hù)業(yè)務(wù)場(chǎng)景上,當(dāng)這個(gè)機(jī)制應(yīng)用到特定場(chǎng)景上時(shí),會(huì)按已成功的案例,做梳理業(yè)務(wù)邏輯并同時(shí)在客戶(hù)內(nèi)的私有云上采集數(shù)據(jù),再用成功案例的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),機(jī)器學(xué)習(xí)算法架構(gòu)來(lái)訓(xùn)練、測(cè)試、驗(yàn)證模型,最終上線運(yùn)行業(yè)務(wù)邏輯,提升業(yè)務(wù)價(jià)值及效益。這樣的機(jī)制主要包含兩項(xiàng)重要元素,方法論和計(jì)算技術(shù)框架:
  • 方法論:對(duì)行業(yè)及業(yè)務(wù)場(chǎng)景整理出流程和規(guī)則,并按此流程和規(guī)則采集積累海量的數(shù)據(jù)。
  • 計(jì)算技術(shù)框架:按實(shí)際應(yīng)用場(chǎng)景,建立算法框架,框架是由各類(lèi)已驗(yàn)證后的神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)算法構(gòu)成的體系,對(duì)每一應(yīng)用場(chǎng)景作全框架計(jì)算測(cè)試評(píng)估,研判出最優(yōu)的神經(jīng)網(wǎng)絡(luò)架構(gòu)和機(jī)器學(xué)習(xí)算法,并同時(shí)調(diào)試參數(shù)和配置。
  普強(qiáng)在金融及相關(guān)領(lǐng)域,積累十年以上的人工智能行業(yè)落地經(jīng)驗(yàn),專(zhuān)注于垂直領(lǐng)域,歸納成功的案例、相關(guān)的業(yè)務(wù)流程規(guī)則和算法算力需求,建立起一套完整的機(jī)制。隨著客戶(hù)的業(yè)務(wù)需求變化和成功案例積累,不斷的擴(kuò)充加強(qiáng)優(yōu)化此機(jī)制,作快速的迭代。
  5、成功案例分享
  A保險(xiǎn)公司為名列世界500強(qiáng)的保險(xiǎn)公司(在本文開(kāi)頭已有提及),普強(qiáng)將語(yǔ)義分析機(jī)制應(yīng)用在A保險(xiǎn)公司的電銷(xiāo)業(yè)務(wù)里,項(xiàng)目一期應(yīng)用在A保險(xiǎn)公司兩個(gè)主要的業(yè)務(wù)區(qū):BJ市和TJ市。對(duì)大約250萬(wàn)的客戶(hù)電銷(xiāo)通話(huà)錄音(約400萬(wàn)通錄音)作落地實(shí)施,其中包括了下列的步驟:
  • 業(yè)務(wù)梳理:與客戶(hù)業(yè)務(wù)人員交流,以對(duì)客戶(hù)的業(yè)務(wù)做深度的了解,與普強(qiáng)機(jī)制框架對(duì)接。
  • 分析流程建立:分析客戶(hù)業(yè)務(wù),建立流程,優(yōu)化流程。
  • 客戶(hù)特征篩選:基于普強(qiáng)的業(yè)務(wù)成功案例,使用大數(shù)據(jù)分析,抽取潛在具有購(gòu)買(mǎi)意愿客戶(hù)特征。
  • 成交相關(guān)度計(jì)算:經(jīng)由普強(qiáng)大數(shù)據(jù)分析框架計(jì)算客戶(hù)特征與成交的相關(guān)度,排序客戶(hù)特征的優(yōu)先順序。
  • 模型建模/訓(xùn)練:普強(qiáng)計(jì)算技術(shù)框架對(duì)最優(yōu)最先進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu)和機(jī)器學(xué)習(xí)算法,作架構(gòu)和算法評(píng)估,測(cè)試不同架構(gòu)和算法的效益優(yōu)劣,及計(jì)算資源需求以及是否能達(dá)到客戶(hù)的時(shí)效要求等工作,最終推薦最優(yōu)的架構(gòu)/算法。
  • 測(cè)試:使用海量的數(shù)據(jù)不斷的測(cè)試,并調(diào)優(yōu)參數(shù),達(dá)到準(zhǔn)確率、召回率等測(cè)試標(biāo)準(zhǔn)的要求,并依照業(yè)務(wù)模式計(jì)算相對(duì)的業(yè)務(wù)效益。
  • 驗(yàn)證:實(shí)際推送普強(qiáng)業(yè)務(wù)流程算法推薦的潛在客戶(hù),驗(yàn)證成交率。
  • 上線:將最終驗(yàn)證通過(guò)的整體機(jī)制上線,進(jìn)入實(shí)際業(yè)務(wù)運(yùn)行。
  與使用普強(qiáng)機(jī)制前業(yè)務(wù)情況對(duì)比的成效如下:
  • 精準(zhǔn)的推薦占總量約15%的潛在有購(gòu)買(mǎi)意愿的優(yōu)質(zhì)客戶(hù)。
  • 推薦的15%的客戶(hù)覆蓋了90%的業(yè)績(jī)。
  • 節(jié)省了80%+的電銷(xiāo)電話(huà),人員時(shí)間。
  • 并減少了對(duì)沒(méi)有意向購(gòu)買(mǎi)客戶(hù)的干擾。
  • 確定了潛在購(gòu)買(mǎi)客戶(hù)的特征,作話(huà)術(shù)優(yōu)化的依據(jù),有定向的與客戶(hù)對(duì)話(huà)以確認(rèn)是否是有所確定的特征。
  • 發(fā)掘了電銷(xiāo)流程的缺失:發(fā)現(xiàn)高購(gòu)買(mǎi)意向客戶(hù)的跟蹤力度不及時(shí)或遺漏的情況,建立追蹤系統(tǒng)及時(shí)找回遺漏的潛在客戶(hù)并跟進(jìn)。
  6、結(jié)語(yǔ)
  隨著計(jì)算力和云存儲(chǔ)容量的大幅提升,海量數(shù)據(jù)的收集,使得以往不能突破的人工智能問(wèn)題均得到突破:如語(yǔ)音識(shí)別、圖像識(shí)別、語(yǔ)義理解等領(lǐng)域。借著這些突破,許多商業(yè)場(chǎng)景都能應(yīng)用這些最新的人工智能突破,而產(chǎn)生實(shí)際的商業(yè)效應(yīng)。
  本文中敘述了語(yǔ)音識(shí)別和語(yǔ)義理解在特定的垂直領(lǐng)域中的應(yīng)用,并詳述案例和其應(yīng)用的效益。此種效應(yīng)隨著科技的進(jìn)步和突破,必能擴(kuò)及更多的場(chǎng)景和商業(yè)應(yīng)用。本文中所述的方法論和技術(shù)計(jì)算框架也必定會(huì)不斷的迭代更新和擴(kuò)充,帶給實(shí)際的業(yè)務(wù)更多的效益。
 
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

評(píng)論排行

專(zhuān)題

CTI論壇會(huì)員企業(yè)

上栗县| 自贡市| 呼玛县| 错那县| 百色市| 巴南区| 德清县| 洛扎县| 昭苏县| 德钦县| 高雄市| 邯郸县| 泾阳县| 丰原市| 沙河市| 北碚区| 辽源市| 德昌县| 裕民县| 崇州市| 太和县| 桓台县| 陇南市| 寻乌县| 翁源县| 乌海市| 黎川县| 汶上县| 义乌市| 马山县| 绥江县| 进贤县| 中山市| 西贡区| 曲松县| 蛟河市| 九台市| 霍邱县| 丰都县| 新闻| 紫云|