亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

 首頁 > 技術(shù) > 技術(shù)文摘 > 科大訊飛副總裁江濤:語音技術(shù)的三大種類

科大訊飛副總裁江濤:語音技術(shù)的三大種類

2011-10-14 00:00:00   作者:   來源:   評論:0 點擊:


  引言:蘋果iPhone 4S的Siri功能推出,可謂是引起了人們對于智能語音技術(shù)的極大關(guān)注。其實,語音技術(shù)非常復(fù)雜,表象繁多,本刊通過采訪國內(nèi)科大訊飛、國筆等專家對目前的語音市場進(jìn)行梳理和探討。
一、不僅僅是語音,還是人工智能
  盡管蘋果“教主”喬布斯離開了我們,盡管iPhone 5沒有入人們期望的那樣出現(xiàn),但是iPhone 4S的推出仍然成功吸引了蘋果粉絲和業(yè)界的所有關(guān)注。根據(jù)美國電話電報公司(AT&T)透露,iPhone 4S在發(fā)布12小時之內(nèi)就接到了20萬份訂單,而其中最引入注目的一大新功能,就是被稱為Siri的語音助手功能。
  10月4日上午,蘋果全球產(chǎn)品副總裁Phil Schiller與負(fù)責(zé)iOS軟件的副總裁Scott Forstall在新品發(fā)布會上,隆重介紹了Siri。

什么是Siri?
  Forstall在現(xiàn)場進(jìn)行了演示,他拿起iPhone 4S,對手機(jī)問道:“今天天氣如何?”屏幕上立刻顯示出今天的天氣狀況。他又接著問,我用帶傘嗎?Siri馬上回答,今天會下雨。隨后,他還用這款應(yīng)用演示了搜索和設(shè)置鬧鐘提、預(yù)約等功能。
  Siri跟普通的語音搜索不一樣,它能明白你所說的,了解你的意思,甚至還能回答你的問題。那感覺就像真正擁有私人助理似的,而且是一位善解人意的私人助理。無論你用何種方式提問,它都能以人的思維去思考和反應(yīng),而不是以預(yù)設(shè)的程序答非所問。
  Siri能為你做的不僅僅是提供答案,它還可以親自替你完成一些基本的事情。比如,你可以吩咐Siri發(fā)短信給你父親、提醒你預(yù)約牙醫(yī)、幫你查找到達(dá)目的地的路線,不用擔(dān)心Siri不夠聰明,因為它能夠思考完成這些事情需要運行哪些應(yīng)用程序,還能明白你要打電話的準(zhǔn)確對象。
  Siri還包括傳聞中的“語音轉(zhuǎn)文字”的功能,你只需按下麥克風(fēng),把你想發(fā)送的內(nèi)容說出來,Siri就可以將你所說的內(nèi)容轉(zhuǎn)換成文字,并發(fā)送出去。除了發(fā)送短信外,Siri還集成到一些第三方應(yīng)用,這樣,你只需動動嘴皮子,就能更新Facebook、發(fā)送Twitter消息或者即時聊天。
  如果你認(rèn)為Siri只是一個簡單的聲音控制軟件,而你的Android手機(jī)上的語音助手或NOKIA語音提示也可做到這點,那你就錯了。
  我們不妨探究一下Siri的血統(tǒng),這家最近剛被蘋果收購的公司,直接發(fā)端于美國軍方的CALO(Cognitive Assistant that Learns and Organizes)項目,這也是史上最大的人工智能項目,匯聚了全球人工智能方面的頂尖專家。
  你如果看過好萊塢大導(dǎo)演斯皮爾伯格的電影《A I》,相信會對人工智能有一定了解,通過人工智能技術(shù),機(jī)器人可以把“對話、自然語言理解、視覺、演說、機(jī)器學(xué)習(xí)、制定計劃、理性思考、服務(wù)代表全部融合到一起”。Siri的技術(shù)正源自人工智能,而不是簡單的搜索和語音識別。它能夠自主分析用戶發(fā)出的口語指令,并給出確切的回應(yīng)和指導(dǎo),完全不需要用戶預(yù)選學(xué)習(xí)使用方法。
  在國外某科技博客錄制的一段視頻中,評測人員對Siri提出了許多含義模糊或有歧義的問題。比如:“附近有沒有什么浪漫的法國餐廳?”,比如:“天空為何是藍(lán)色的?”比如“鋼琴上有多少個八度?”對人類而言,這些句子再平常不過了,但要讓機(jī)器去理解這些變化多端的棘手詞匯,尤其是“浪漫”這種形容詞,那就極端困難了,然而這些問題Siri都可以回答。
  你甚至還可以對Siri表白,對它說:“我愛你!”它的回答也很妙:“希望你不會對其它手機(jī)也這么說。”
  該評測人員隨后在博客中寫到:“Android系統(tǒng)的Voice Actions也是一項偉大的技術(shù),但說真的,它和Siri不是同一個層面的產(chǎn)品。Siri非?幔c之相比Voice Actions雖說確實讓我們省去了打字輸入、觸摸操作的工序,但操作太復(fù)雜,只有那些Geek會使用它。然而,媽媽們會選擇Siri!
二、語音技術(shù)的三大種類
  除了人工智能,Siri的核心功能仍是基于語音識別的語音技術(shù),其語音引擎來自Nuance,這家公司在全球手機(jī)輸入法上處于壟斷地位。
  這一技術(shù)并非革 命性的變革,早在計算機(jī)發(fā)明之前,自動語音識別的設(shè)想就已經(jīng)被提上了議事日程,早期的聲碼器可被視作語音識別及合成的雛形。而1920年代生產(chǎn)的“Radio Rex”玩具狗可能是最早的語音識別器,當(dāng)這只狗的名字被呼喚的時候,它能夠從底座上彈出來。
  近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始逐漸從實驗室走向市場。據(jù)了解,許多大公司如IBM、蘋果、微軟、Google、AT&T和NTT等早在多年前都對語音識別系統(tǒng)的實用化研究投以巨資。目前主流的語音技術(shù)方案包括IBM公司推出的Via Voice和Dragon System公司的Naturally Speaking, ,Nuance公司的Nuance Voice Platform語音平臺,Microsoft的Whisper,Sun的VoiceTone,以及科大訊飛的口訊等。

共 3 頁:1 2 3 

電子工程專輯

相關(guān)閱讀:

分享到: 收藏

專題