亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

<kbd id="ueo4k"><td id="ueo4k"></td></kbd><acronym id="ueo4k"></acronym>

<blockquote id="ueo4k"><object id="ueo4k"></object></blockquote>

首頁|新聞|商城|黃頁|技術(shù)|行業(yè)|會(huì)展|訪談|人才|供求|社區(qū)|周刊|呼叫中心|企業(yè)通信|通信業(yè)務(wù)

首頁 > 新聞 > 專家觀點(diǎn) >

技術(shù)提取智慧：文本挖掘的三大應(yīng)用

2016-06-29 09:25:18 作者：杜爾森·德倫(Dursun Delen) 來源：36大數(shù)據(jù) 評(píng)論：0 　點(diǎn)擊：

　　隨著各種機(jī)構(gòu)收集的非結(jié)構(gòu)化數(shù)據(jù)不斷增加，文本挖掘的價(jià)值定位和流行度也處于上升階段。越來越多的機(jī)構(gòu)意識(shí)到利用文本挖掘從他們的文本資源庫中提取知識(shí)的重要性。

　　以下將展示文本挖掘模范式的應(yīng)用類別中的一小部分。

　　市場(chǎng)營銷應(yīng)用

　　通過分析客服中心提供的非結(jié)構(gòu)化數(shù)據(jù)，文本挖掘可以提高交叉銷售和向上銷售的業(yè)績。由客服中心接線人員所做的記錄整理而成的文本，以及轉(zhuǎn)錄的與顧客的對(duì)話可以被文本挖掘算法用來提取新穎、可操作的信息，旨在了解消費(fèi)者對(duì)公司產(chǎn)品及服務(wù)的看法。此外，博客、產(chǎn)品評(píng)價(jià)以及網(wǎng)上討論板塊的帖子則是了解顧客情感的金礦。這些豐富的信息資源只要加以恰當(dāng)?shù)姆治鼍湍軌虮挥糜谔岣哳櫩蜐M意度，延長顧客的整體忠誠度。

　　文本挖掘同時(shí)已經(jīng)成為消費(fèi)者關(guān)系管理不可或缺的工具。公司用文本挖掘分析豐富的非結(jié)構(gòu)化數(shù)據(jù)，再聯(lián)合企業(yè)數(shù)據(jù)庫中相關(guān)的結(jié)構(gòu)化數(shù)據(jù)，就可以預(yù)測(cè)消費(fèi)者的觀念以及后續(xù)的購買行為。舉例來說，文本挖掘可以有效地提高數(shù)學(xué)模型的效用，以預(yù)測(cè)顧客流失率。這樣，就能夠?qū)δ切┍涣腥胱钣锌赡芰魇У念櫩图皶r(shí)使用“挽留技巧”來保留。

　　將產(chǎn)品看作一系列屬性值對(duì)而不是原子實(shí)體，可以潛移默化地提高多種商業(yè)應(yīng)用的有效性，例如，需求預(yù)測(cè)、分類優(yōu)化、產(chǎn)品推薦、零售商與生產(chǎn)商間的分類比較，還有產(chǎn)品供應(yīng)商選取。伽尼(Ghani)使用文本挖掘技術(shù)開發(fā)了一個(gè)系統(tǒng)來推測(cè)產(chǎn)品的顯性和隱性屬性，以加強(qiáng)零售商分析產(chǎn)品數(shù)據(jù)庫的能力。系統(tǒng)以各種屬性的形式展現(xiàn)產(chǎn)品，不需要多少人力就能夠根據(jù)不同屬性分配價(jià)值。系統(tǒng)通過將監(jiān)控的和半監(jiān)控的學(xué)習(xí)技術(shù)應(yīng)用到零售商網(wǎng)站的產(chǎn)品描述上，以了解這些屬性。

　　安保應(yīng)用

　　文本挖掘在安保領(lǐng)域最廣泛、最著名的應(yīng)用要算是高機(jī)密的美國ECHELON監(jiān)控系統(tǒng)了。傳聞ECHELON能夠識(shí)別電話、傳真、郵件和其他各類形式數(shù)據(jù)的內(nèi)容，攔截通過衛(wèi)星、公共交換電話網(wǎng)和其他微波傳送的信息。

　　2007年，歐洲刑警組織開發(fā)了一款綜合系統(tǒng)以獲取、儲(chǔ)存、分析數(shù)量龐大的結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)源，追蹤跨境的有組織犯罪。該系統(tǒng)被命名為“情報(bào)支持綜合分析系統(tǒng)”，旨在整合當(dāng)今市場(chǎng)上最先進(jìn)的數(shù)據(jù)和文本挖掘技術(shù)。系統(tǒng)在跨境執(zhí)法方面大大提高了歐洲刑警組織的效率。

　　在美國國家安全局的指導(dǎo)下，聯(lián)邦調(diào)查局和中央情報(bào)局正聯(lián)手開發(fā)超級(jí)計(jì)算機(jī)數(shù)據(jù)與文本挖掘系統(tǒng)。該系統(tǒng)旨在構(gòu)建一個(gè)巨型數(shù)據(jù)倉庫以及一批種類多樣的數(shù)據(jù)和文本挖掘模塊，并以此為聯(lián)邦、各州和地方執(zhí)法機(jī)構(gòu)的知識(shí)發(fā)現(xiàn)提供支持。在這之前，聯(lián)邦調(diào)查局和中央情報(bào)局也擁有各自獨(dú)立的數(shù)據(jù)庫，但是這些數(shù)據(jù)庫之間基本沒有什么關(guān)聯(lián)。

　　另一個(gè)與安保有關(guān)的文本挖掘應(yīng)用實(shí)例就是測(cè)謊。夫勒(Fuller)將文本挖掘與罪犯(或嫌疑犯)的真實(shí)供述相關(guān)聯(lián)，研發(fā)出預(yù)測(cè)模型以區(qū)分謊言和實(shí)話。模型利用從文本陳述中提取的豐富線索預(yù)測(cè)不合作樣本，準(zhǔn)確率高達(dá)70%�？紤]到線索僅僅來自于文本陳述，沒有口頭和視覺線索，這樣的準(zhǔn)確率算得上是有著重大意義的成功。此外，與測(cè)謊儀等其他測(cè)謊技術(shù)相比，這種方法避免了過多的中介物干擾，并且不僅可以用于文本，還可以用于語音錄音腳本的可能性。

　　生物醫(yī)學(xué)應(yīng)用

　　文本挖掘在眾多醫(yī)學(xué)領(lǐng)域和某些生物醫(yī)學(xué)領(lǐng)域有著巨大的應(yīng)用前景。第一，該領(lǐng)域的出版發(fā)行文獻(xiàn)和出版專營店(特別是隨著“開源期刊的出現(xiàn)”)正以指數(shù)爆炸的速度增長；第二，與其他形式的文獻(xiàn)相比，醫(yī)學(xué)文獻(xiàn)更加標(biāo)準(zhǔn)化，有秩序，更便于挖掘；最后，醫(yī)學(xué)文獻(xiàn)的術(shù)語相對(duì)統(tǒng)一固定，本體相當(dāng)?shù)貥?biāo)準(zhǔn)化。一些教科書式的經(jīng)典范例已經(jīng)成功地利用文本挖掘技術(shù)從生物醫(yī)學(xué)文獻(xiàn)中提取了新型模式。

　　實(shí)驗(yàn)性技術(shù)，比如基因芯片技術(shù)分析、基因表達(dá)序列分析和質(zhì)譜蛋白質(zhì)組學(xué)的研究產(chǎn)生了大量與基因、蛋白質(zhì)相關(guān)的數(shù)據(jù)。正如其他實(shí)驗(yàn)性方式，一般來說，在先前已知的生物實(shí)體信息情景下分析這些數(shù)據(jù)是必不可少的。文獻(xiàn)資料在驗(yàn)證實(shí)驗(yàn)有效性和闡釋實(shí)驗(yàn)方面意義重大。因此，研發(fā)自動(dòng)文本挖掘工具以協(xié)助這類闡釋是當(dāng)今生物信息學(xué)研究所面臨的主要挑戰(zhàn)之一。

　　清楚細(xì)胞中蛋白質(zhì)的位置有助于闡明蛋白質(zhì)在生物作用中的角色，并確定它能否作為藥物標(biāo)靶。文獻(xiàn)中包含了不計(jì)其數(shù)的定位預(yù)測(cè)系統(tǒng)，一些關(guān)注具體的生物，另一些則試圖分析更大范圍內(nèi)的生物。沙特凱(shatkay)等人在2007年提出的一個(gè)綜合系統(tǒng)能夠利用幾種基于序列和文本的特征來預(yù)測(cè)蛋白質(zhì)的位置。該系統(tǒng)的創(chuàng)新點(diǎn)在于它選取文本來源和特征的方式，并能夠?qū)⑦@些數(shù)據(jù)與基于序列的特征整合起來。沙特凱等人在先前的數(shù)據(jù)組和新的數(shù)據(jù)組上都測(cè)試了系統(tǒng)的預(yù)測(cè)能力，結(jié)果顯示，新系統(tǒng)的效果遠(yuǎn)遠(yuǎn)地超過了原有系統(tǒng)。

　　春(chun)描述了一種能夠通過美國醫(yī)學(xué)索引從文獻(xiàn)中提取致病基因關(guān)系的系統(tǒng)。他們?cè)诹鶄€(gè)公共數(shù)據(jù)庫的基礎(chǔ)上建立了疾病與基因字典，用字典匹配提取候選的關(guān)系項(xiàng)。由于字典匹配會(huì)產(chǎn)生大量的假陽性結(jié)果，春等人又研發(fā)了基于機(jī)器學(xué)習(xí)的命名實(shí)體識(shí)別，以篩選出錯(cuò)誤的疾病或基因名稱。他們發(fā)現(xiàn)這種關(guān)系提取的成功與否主要取決于命名實(shí)體識(shí)別在篩選上的表現(xiàn)，篩選能夠提高26.7%的提取準(zhǔn)確性，而花費(fèi)的代價(jià)僅僅是查全率上的微小滑坡。

　　對(duì)于掌握大型信息數(shù)據(jù)庫的出版商們來說，文本挖掘可以用來產(chǎn)生索引以更好地進(jìn)行信息檢索。在科學(xué)性學(xué)科中，由于具體信息常包含在書面文本中，這點(diǎn)尤為突出。如《自然》雜志提倡的“開放式文本挖掘接口”和美國國家衛(wèi)生研究院的“期刊出版文檔類型定義”這樣的新項(xiàng)目已經(jīng)開始實(shí)施，預(yù)期能夠?yàn)闄C(jī)器提供語義線索，以回答文本中的具體問詢而不消除公共通道的出版商壁壘。

　　學(xué)術(shù)型機(jī)構(gòu)也加入到了文本挖掘計(jì)劃的行列中。英國曼徹斯特大學(xué)和利物浦大學(xué)聯(lián)合成立了文本挖掘國家中心，為學(xué)術(shù)社區(qū)提供定制的文本挖掘工具，研究設(shè)備和文本挖掘?qū)I(yè)意見。起初，文本挖掘的重點(diǎn)被放在了生物和生物醫(yī)學(xué)上，但逐漸擴(kuò)大到了社會(huì)科學(xué)。美國加州伯克利大學(xué)的信息學(xué)院正在開發(fā)一款名為Biotext的軟件，以在文本挖掘和分析方面協(xié)助生物科學(xué)研究者。

相關(guān)熱詞搜索：文本挖掘

上一篇:Fintech潮起為何移動(dòng)金融發(fā)展?jié)撃懿豢晒懒浚?/a>

下一篇:最后一頁

相關(guān)閱讀：

分享到：

分享到騰訊微博

收藏

評(píng)論排行

推薦閱讀

專題

免費(fèi)試用JABRA B...: 免費(fèi)試用音質(zhì)卓越且堅(jiān)固耐用的Jabra BIZ 系列專業(yè)耳麥[詳細(xì)]

12301國家智慧旅游...: 由12301國家智慧旅游公共服務(wù)平臺(tái)主辦、CTI論壇承辦的1...[詳細(xì)]

2016語音技術(shù)產(chǎn)業(yè)概覽: 智能虛擬助理，手機(jī)和網(wǎng)絡(luò)設(shè)備，統(tǒng)一全渠道環(huán)境，基于云...[詳細(xì)]

2016世界電信和信...: 世界電信日自1969年起每年均在5月17日慶祝，這一天也是...[詳細(xì)]

點(diǎn)擊排行
周排行
月排行

網(wǎng)站首頁 | 公司簡介 | 聯(lián)系方式 | 工作機(jī)會(huì) | 廣告服務(wù) | 會(huì)員服務(wù) | 服務(wù)項(xiàng)目 | 專家團(tuán)隊(duì) | 版權(quán)聲明 | 投稿方法

Copyright(C) 1999-2015 CTI論壇 All Rights Reserved CTI論壇版權(quán)所有

電話：+86-10-82012787，+86-10-82079677 傳真：+86-10-62041062 投稿：ctiforum@ctiforum.com 地址：北京市西城區(qū)新德街20號(hào)513室（100088）

經(jīng)營性網(wǎng)站備案信息

京ICP證030771號(hào)

網(wǎng)絡(luò)110報(bào)警服務(wù)

京公網(wǎng)安備110102000104-1號(hào)

<tr id="qwquw"></tr>

<dfn id="qwquw"></dfn>

<samp id="qwquw"><noframes id="qwquw"></noframes></samp>

<source id="qwquw"></source>

<option id="qwquw"></option>