亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

 首頁 > 新聞 > 專家觀點(diǎn) >

如何搶灘智能語音字號 打造人機(jī)智能語音交互時代

2014-06-18 09:46:14   作者:   來源:中國計算機(jī)報   評論:0  點(diǎn)擊:


  各展所長 開放競合

  隨著谷歌、微軟、IBM等IT巨頭加快對智能語音領(lǐng)域的布局,以及Nuance在中國的本土化不斷加強(qiáng),國內(nèi)語音企業(yè)將面臨越來越大的競爭壓力。相較于Nuance等國際巨頭,國內(nèi)語音企業(yè)在研發(fā)力量、創(chuàng)新能力、集成應(yīng)用、行業(yè)應(yīng)用拓展等方面還有不小差距。國內(nèi)語音企業(yè)間的合作、并購、整合步伐也相對要緩慢一些。

  對于國內(nèi)語音企業(yè)的發(fā)展,作為行業(yè)專家的李德升給出了他的見解和建議。他認(rèn)為,在傳統(tǒng)語音技術(shù)廠商中,科大訊飛的實(shí)力有目共睹,而捷通華聲的語音合成在鐵路交通、金融電信等領(lǐng)域也有較高的市場占有率,很多高鐵、公交站等的報站語音是捷通華聲做的。對于這類廠商,李德升給出的建議是得專注于語音,引入互聯(lián)網(wǎng)思維,真正做大做強(qiáng)。對于百度、騰訊、搜狗等互聯(lián)網(wǎng)廠商做語音,李德升認(rèn)為他們具有最豐富的互聯(lián)網(wǎng)語音資源,更重要的是他們有技術(shù)實(shí)力、有用戶、有互聯(lián)網(wǎng)思維,這些廠商最有可能可以和國外競爭者一較高下。而對于第三類語音創(chuàng)業(yè)企業(yè),李德升的建議是盡量采取合作方式,與互聯(lián)網(wǎng)廠商合作,專注于特定行業(yè)領(lǐng)域積累實(shí)力,既不能小富即安,也不能貪高大上,只要積極進(jìn)取,踏實(shí)經(jīng)營,還是有非常大的成長空間的。

  “其實(shí),以蘋果為代表的軟硬件一體化廠商做語音是為了賣硬件產(chǎn)品,互聯(lián)網(wǎng)廠商大多是從幫助用戶搜索的角度做語音,相對于創(chuàng)業(yè)型的語音企業(yè),科大訊飛的優(yōu)勢就在于語音的寬度和厚度積累,優(yōu)勢就在于多年來對語音識別、語音合成、語音評測與語義理解各方面立體的投入和研究,目前擁有全方位立體的語音技術(shù)產(chǎn)品。”江濤說,在語音推廣方面,科大訊飛堅持兩條腿走路:一是堅持移動互聯(lián)網(wǎng)能力開發(fā),一是通信、教育和安全等重點(diǎn)行業(yè)推進(jìn)。逐步拓展移動互聯(lián)網(wǎng)能力的三駕馬車是手機(jī)、汽車和智能電視。目前科大訊飛手機(jī)語音已經(jīng)有四億的用戶,每天活躍用戶達(dá)四千多萬。在教育領(lǐng)域,科大訊飛的語音合成、語音評測在廣東高考英語口語考試,西部中小學(xué)的英語教具和日常教學(xué)中已經(jīng)發(fā)揮很大作用;而在安全領(lǐng)域,公安部第一個跟企業(yè)合辦的部級重點(diǎn)實(shí)驗(yàn)室—公安部聲紋實(shí)驗(yàn)室就設(shè)在科大訊飛。

  江濤也坦言,相較于百度等互聯(lián)網(wǎng)巨頭做語音,傳統(tǒng)語音技術(shù)廠商確實(shí)存在一些劣勢,“在整個大的開發(fā)平臺、云存儲、位置服務(wù)和構(gòu)建整個生態(tài)系統(tǒng)方面,互聯(lián)網(wǎng)公司確實(shí)值得我們學(xué)習(xí)。我們還是要專心做好自己所長,聚焦在語音和語義方面,真正做好開發(fā)者服務(wù),基于語音和語義構(gòu)建生態(tài)系統(tǒng),嘗試推廣人機(jī)交互廣告等。”

  “互聯(lián)網(wǎng)巨頭要擁有語音這個技術(shù),不被別人卡住喉嚨,但他們有自己的主業(yè),不會放太多精力在語音上。”張連毅如此判斷,“語音技術(shù)廠商只要做好自己的技術(shù)和產(chǎn)品,保持開放合作就能獲得良好的發(fā)展。”除了夯實(shí)智能語音市場,捷通華聲更要做的是實(shí)現(xiàn)包括智能語音、圖像識別(OCR)、生物特征識別在內(nèi)的全方位的人機(jī)智能交互。

  說到與其他廠商的競爭,云知聲并不擔(dān)心。干凈環(huán)境下朗讀語音的識別早已不是問題,特殊場景應(yīng)用大幅提升,語音市場未來潛力巨大。黃偉認(rèn)為,語音這個市場足夠大,找準(zhǔn)各自細(xì)分的目標(biāo)市場,只要各自做得好,都能分到自己那杯羹,生存發(fā)展的機(jī)會很大。云知聲除了做金融等行業(yè)應(yīng)用推廣,主要聚焦在視頻和車載領(lǐng)域。而對于全智能交互,云知聲的策略是連橫—聯(lián)合多家創(chuàng)業(yè)公司,包括語義理解技術(shù)公司哦啦、圖像識別技術(shù)公司亮風(fēng)臺、人臉識別技術(shù)公司Face++成立了全智能交互聯(lián)盟,將語音、圖像、人臉交互方案打包,期待不同的交互技術(shù)發(fā)生化學(xué)反應(yīng),用做乘法代替做加法,為用戶打造最佳的全智能交互體驗(yàn)。除此之外,云知聲仍將專注于云(移動應(yīng)用、呼叫中心、在線教育)、端(智能終端包括智能家電、可穿戴設(shè)別、智能車載等)、芯(智能芯片)領(lǐng)域的智能語音推廣與應(yīng)用。

  的確,這是一個蓬勃向上的時代,也是一個不進(jìn)則退的時代。中國語音技術(shù)企業(yè)只要抱定“以針破天”的信念,專注堅持,踏實(shí)積累,把握機(jī)遇,就能鯤鵬擊浪,展翅怒飛,扶搖直上九萬里。加油吧,中國智能語音。

  百度語音SDK功能特點(diǎn)

  • 微工作量就可以開發(fā)出連接

  百度語音服務(wù)的客戶端應(yīng)用

  • 支持Android和iOS平臺SDK
  • 針對場景深度優(yōu)化
  • 針對領(lǐng)域優(yōu)化,使垂直類應(yīng)用

  有更好的識別效果

  • 用戶定制化識別
  • 自動端點(diǎn)斷點(diǎn)檢測和數(shù)據(jù)傳輸,極致優(yōu)化流量消耗
  • 豐富可配置的UI組件
  • 提供底層API,使用方式更加 靈活強(qiáng)大
分享到: 收藏

專題