視頻中,用戶在問第二個(gè)問題時(shí),并沒有提到城市,但是客服機(jī)器人可以準(zhǔn)確回答珠海分行?头䴔C(jī)器人「機(jī)智過人」的背后,便是來自捷通華聲AI硬核技術(shù)——知識(shí)圖譜。
知識(shí)圖譜可以將非結(jié)構(gòu)化、結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)經(jīng)過知識(shí)抽取、知識(shí)融合、知識(shí)加工等方法構(gòu)建成有關(guān)聯(lián)關(guān)系的圖模型。知識(shí)圖譜由實(shí)體、關(guān)系和屬性三部分構(gòu)成,能夠非常清晰的體現(xiàn)不同實(shí)體之間的關(guān)系。在智能客服中,知識(shí)圖譜利用知識(shí)庫(kù)來輔助理解用戶問話內(nèi)容。

以上圖為例,張京的「職業(yè)」是翻譯,她的「國(guó)籍」是中國(guó)…在知識(shí)圖譜中,將客觀存在的「職業(yè)」和「國(guó)籍」等屬性關(guān)系,作為連接線,將張京與個(gè)人標(biāo)簽之間進(jìn)行連接。當(dāng)然,除此外,張京還有很多個(gè)人標(biāo)簽,比如畢業(yè)院校外交學(xué)院,漢族等等。
在現(xiàn)實(shí)世界中還存在很多隱性或復(fù)雜的關(guān)系。在客服領(lǐng)域,這種關(guān)系同樣存在,這就需要對(duì)各種關(guān)系不斷的挖掘,從而構(gòu)建龐大的知識(shí)圖譜,以便更好的服務(wù)用戶。
知識(shí)圖譜構(gòu)建
簡(jiǎn)單來說,知識(shí)圖譜的構(gòu)建類和思維導(dǎo)圖非常相似,只要找到關(guān)聯(lián)關(guān)系,就可以將各個(gè)實(shí)體連接起來,主要包括知識(shí)抽取、知識(shí)融合及知識(shí)加工。
知識(shí)抽取
知識(shí)抽取就是從獲取到的各種原始數(shù)據(jù)中提取出實(shí)體、關(guān)系和屬性。知識(shí)抽取步驟所涉及的數(shù)據(jù)有非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。以非結(jié)構(gòu)化數(shù)據(jù)的關(guān)系抽取為例,可以分為開放領(lǐng)域關(guān)系抽取和限定領(lǐng)域三元組抽取。
- 限定領(lǐng)域關(guān)系抽取
限定領(lǐng)域三元組抽取是在一個(gè)或多個(gè)限定的領(lǐng)域內(nèi)對(duì)實(shí)體間的語義關(guān)系進(jìn)行抽取,即實(shí)體領(lǐng)域已做限制,如:
數(shù)據(jù):以下是鈞達(dá)股份在北京時(shí)間9月19日14:26分盤口異動(dòng)快照:9月19日,鈞達(dá)股份盤中快速上漲,5分鐘內(nèi)漲幅超過2%,截至14點(diǎn)26分,報(bào)18.05元,成交3310.86萬元,換手率4.92%。
抽取結(jié)果:鈞達(dá)股份,漲跌幅,超過2%
- 開放領(lǐng)域三元組抽取
開放領(lǐng)域三元組抽取是依據(jù)模型對(duì)自然語言句子理解的結(jié)果進(jìn)行開放式抽取實(shí)體關(guān)系,即對(duì)實(shí)體領(lǐng)域不做限制,如:
數(shù)據(jù):7月19日,河南省自然資源廳地質(zhì)勘查處陳軍副處長(zhǎng)協(xié)同自然資源部專家孟立山組成省廳地質(zhì)災(zāi)害防治調(diào)研組蒞臨方城縣調(diào)研指導(dǎo)工作。
抽取結(jié)果:河南省自然資源廳,副處長(zhǎng),陳軍
知識(shí)融合
知識(shí)抽取完成后,需要將不同類型實(shí)體信息進(jìn)行知識(shí)融合,即將不同知識(shí)庫(kù)的同一實(shí)體和同一屬性分別融合在一起。
- 屬性融合
把來自不同知識(shí)庫(kù)或名稱不同但表示特征相同的屬性進(jìn)行信息融合,將同一實(shí)體中等價(jià)的屬性進(jìn)行歸類統(tǒng)一,如:「注冊(cè)地,注冊(cè)地點(diǎn),注冊(cè)地址」融合為「注冊(cè)地址」
- 實(shí)體融合
對(duì)表示同一個(gè)對(duì)象的多個(gè)實(shí)體之間構(gòu)建對(duì)齊關(guān)系,同時(shí)對(duì)實(shí)體包含的信息進(jìn)行融合和聚集。如:「捷通華聲,捷通華聲靈云,捷通華聲科技股份有限公司」屬性值相同融合。
知識(shí)加工
對(duì)知識(shí)圖譜進(jìn)一步補(bǔ)充擴(kuò)展,形成更加靈活的知識(shí)大腦。
知識(shí)圖譜功能
捷通華聲的知識(shí)圖譜支持查詢實(shí)體或?qū)嶓w對(duì)應(yīng)屬性、查詢多個(gè)實(shí)體間的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)實(shí)體間的屬性值進(jìn)行計(jì)算,以及根據(jù)多個(gè)實(shí)體的屬性值進(jìn)行篩選等功能。
屬性查找
查詢實(shí)體或?qū)嶓w對(duì)應(yīng)屬性時(shí),對(duì)于某一實(shí)體以及實(shí)體對(duì)應(yīng)的某種屬性進(jìn)行提問,返回其答案。例如當(dāng)圖譜數(shù)據(jù)為:姚明-身高-226cm
Q:姚明的身高是多少?
A:姚明的身高是226cm
關(guān)系查詢
查詢多個(gè)實(shí)體間的關(guān)聯(lián)關(guān)系時(shí),對(duì)于多個(gè)實(shí)體之間的關(guān)聯(lián)關(guān)系提問,返回其關(guān)系。例如圖譜數(shù)據(jù)包括“葉惠美-兒子-周杰倫”和“周杰倫-妻子-昆凌”
Q:葉惠美和昆凌什么關(guān)系?
A:葉惠美的兒子是周杰倫,周杰倫的妻子是昆凌
插值計(jì)算
實(shí)現(xiàn)實(shí)體間的屬性值進(jìn)行計(jì)算,例如圖譜數(shù)據(jù)為“小明-年齡-5”和“小王-年齡-6”
Q:小王比小明大幾歲?
A:1歲
按值篩選
根據(jù)多個(gè)實(shí)體的屬性值進(jìn)行篩選,例如圖譜數(shù)據(jù)為“小明年齡5”,“小王年齡6”,以及“小洪年齡7”
Q:6歲以下的人有哪些?
A:小明,小王