首頁>>廠商>>語音識別與合成>>Nuance

Nuance:車載信息平臺邁入語音時代

2010/12/27

  2010年12月8日,Nuance通訊公司全球車載業(yè)務部副總裁 Arnd Weil、大中華區(qū)總經理鄭裕慶和上海研發(fā)中心總監(jiān)張亞昕博士就Nuance車載業(yè)務和自然語音技術等方面接受了蓋世汽車網的專訪。


  從左至右,Nuance通訊公司上海研發(fā)中心總監(jiān)張亞昕、全球車載業(yè)務部副總裁Arnd Weil和大中華區(qū)總經理鄭裕慶。

  蓋世汽車網:請介紹一下Nuance車載業(yè)務及在中國的發(fā)展情況。

  Arnd Weil:簡單來講,Nuance提供移動免提的解決方案,用于打電話、發(fā)信息、讀信息,通過語音操作來播放音樂、選歌和進行導航。在導航方面,比如用戶報出一個地點,我們的產品就可以進行路線搜索。

  車載業(yè)務是屬于Nuance移動的汽車業(yè)務部旗下的一個業(yè)務。汽車業(yè)務部的產品和服務范圍,不單有車內應用方案,還有重點開發(fā)互聯服務和車載解決方案,將用戶介面設計結合連接服務器端車內應用和互聯服務。目前前裝和后裝市場已經分別有超過三千五百萬的汽車已經在用Nuance 語音技術。

  Nuance一直跟國際的廠家有合作關系,通過Continental和Bosch等公司進入中國市場。我們的汽車業(yè)務在過去10年合作的公司包括福特、戴姆勒、寶馬、奧迪、通用、豐田等公司。我們同福特公司從十年前開始在語音技術方面有合作,現在是其語音技術直接供應商和用戶界面設計的合作伙伴。

  Nuance對中國市場很重視,去年開始也跟中國本土汽車廠家合作。我們在中國市場建立了專業(yè)的團隊研發(fā)新產品,像上海的語音技術開發(fā)中心,除了有本土工程師參與開發(fā)過程,全球的專業(yè)團隊也在開發(fā)更適合中國市場的語音解決方案。

  蓋世汽車網:Nuance公司有什么競爭的技術上的優(yōu)勢?

  Arnd Weil:Nuance提供非常好的語音用戶界面和車用人機界面,支持 30多種語言,無論是車內應用連接終端、服務器終端或聯網服務,我們都可以支持。Nuance還可以提供多模式輸入技術,包括手寫和應用于觸摸屏的智能文本輸入。

  在語音方面,Nuance 語音技術已經通過很多國家的認證和測試,證明Nuance的識別技術準確率相當高。Nuance能為不同國家的語言提供非常好的支持。這么多年累計下來的經驗和成功的案例就是很好的證明。這是其他的競爭對手無法超越的。

  蓋世汽車網:Nuance語音識別技術對帶口音的普通話的辨識度有多少?

  張亞昕:Nuance從一開始做中文語音識別的時候,就意識到中國面積廣大,各種口音繁雜。但是要去做每一個地方方言的語音識別是不太現實的,再加上中國政府一直在鼓勵全國推行普通話,所以我們還是爭取把普通話識別技術做到更好。所以我們從采集數據階段就開始著手,從全中國采集聲音樣本,南到廣州、福建,北到黑龍江甚至西北。因此我們的語音識別對各種帶口音的普通話的識別率是很高的。

  曾經有客戶將我們的引擎拿去和另外一家公司做對比測試,在口音測試方面,我們的競爭對手在不同人的測試上,識別率差異非常大,大部分人可能普通話還比較標準,個別的口音不標準,曲線波動很明顯。但是Nuance的測試曲線變化非常小,個人之間的差異非常小,說明我們在口音的覆蓋上面做的非常好。

  蓋世汽車網:請談談語音識別技術研發(fā)難點和未來發(fā)展趨勢。

  張亞昕:我想難點和趨勢要一起說,因為難點是我們將來要攻克的,也是我們以后要發(fā)展的方向。傳統的語音識別都會限定命令詞,比如命令里定義“打開空調”,你就只能說“打開空調”,多說、少說一個字,或者換種方式說,它都無法識別。這實際上是對人的限制,用戶必須將每個命令詞記的非常準確。如果命令詞將來定義越來越多,普通用戶很難嚴格記準每一個命令詞。

  所以解決方案里面,我們通過語音技術讓用戶能夠很輕松的進行自然且直觀的交流與互動。我們只定義任務,不定義命令詞,只要你把任務用你自己的表達方式表達出來就能完成。這個叫自然語言理解技術,已應用在北美市場銷售的福特汽車上,配合新一代MyFord Touch技術的SYNC系統中實現。

  鄭裕慶:其實自然語言處理的難度我們已經攻克。我們有引擎設在呼叫中心,可以實現隨便你說什么,都能夠做出相應的處理。但是用于車載和手機的引擎是比較小的,一旦壓縮,識別率會受到限制。因此怎樣進一步提升車載系統的語音識別性能,是我們目前工作的目標之一。

  蓋世汽車網:自然語音技術的價格定位在哪個級別?

  鄭裕慶:針對高端市場,我們可以提供所謂“ one shot”的解決方案,就是一句話輸入,系統會分析你要做什么。這個成本比較高。如果只是打電話或者控制音樂,價格就會便宜很多。所以我們是用不同的功能來定位市場價格。

  蓋世汽車網:有不同的市場定位。

  鄭裕慶:對。比如通過語音控制手機撥號在低端車里面也可以實現,價格會相對較低。但是有一些汽車包含控制整個系統,包括空調,音樂,導航,再加上云端的服務,價格就比較高,當然這些只在高端車里面出現。因為其實你要做這么多東西,除了我們的軟件技術價格會高以外,其他的東西好像內存、CPU,整個硬件配置也會相應提高。

  蓋世汽車網:就Nuance目前的業(yè)務來看,語音、文字智能輸入和圖象解決方案,三大塊業(yè)務的比重各占多少?

  鄭裕慶: 語音的業(yè)務是最核心的,占到85%。你可以看到我們覆蓋到手機、汽車,我們現在可以做到的就是電子書、電腦。接下來我們要做IPTV,交互式網絡電視。還有在呼叫中心和醫(yī)療,都做得很大。醫(yī)療方面是用語音來輸入那些病人的病例并存檔。因此語音是Nuance最主要的一個業(yè)務。

  蓋世汽車網:Nuance在中國推廣車載語音系統產品時采取了怎樣的市場策略?

  鄭裕慶:中國用戶追求物美價廉,因此我們在他們提供的條件下調整策略,在中國實施比較靈活的價格策略,根據市場需求去定價。在支持服務方面我們會選擇一些比較好的廠家,投入我們的人力、時間同他們一起去按照他們的需求開發(fā)相應產品,以保證產品出來以后有高質量和非常高的客戶滿意度。

  蓋世汽車網:Nuance最近在中國進行了用戶對車載語音應用的調研,可否分享其中一些調查結果。

  張亞昕:我們最近在中國做了一個汽車GPS用戶調研,幾百位中國的汽車駕駛者參與了我們的調研,主要圍繞車內是否裝有語音系統和使用頻率等問題。接近30%的車內有語音控制功能,它超出了我的預想。實際上很多人都對語音控制、語音撥號感興趣。比如空調升高兩度,收音機調到97.7Hz,或者是打電話給張三,這種命令他們非常感興趣。

  蓋世汽車網:這個應該在您意料之中的吧?

  張亞昕:這個是在我意料之中的,但是有一件事情在我意料之外。43.5%接受調研的人會一邊開車一邊發(fā)短信,這是非常危險的事。其中的15.5%是一邊行車一邊發(fā)短信,還有28%的人表示在等紅燈的時候發(fā)短信,但是你可以想象如果變成綠燈,他們會繼續(xù)把沒有發(fā)完,很不安全。

  鄭裕慶:所以很多時間我在等紅綠燈,前面的車等到了綠燈還沒有走,很有可能是在發(fā)短信或者打電話。

  張亞昕:國外很多國家已經頒布法令,嚴格要求開車期間不許打手機,不允許發(fā)短信,但是在中國有這么多人邊開車,邊發(fā)短信,是不可想象的事情。

  還有一個問題出乎我意料之外的。車載語音識別因為車內環(huán)境特殊,噪音比較大,識別率會偏低,效果不如安靜環(huán)境下,但依然有82.3%的人認為它是合格的。

  鄭裕慶:現時應用車載語音識技術基本上都是高端車。因為我也知道國內有些廠家在低端車上配置語音識別,效果很不好。其實是沒有達到這個標準。現在一些用戶同我們合作,就是因為以前有用一些國內的技術,然后發(fā)覺真的不行了,再找我們重新做。其實門檻是比較高的,過不了這個門檻無法滿足用戶最終需求。比如福特在美國,打廣告是賣它的語音控制系統。通過改變用戶體驗,坐上來覺得安全的同時還能更加有賣點。我相信今后國內很多車企也會朝這個方向走。
共 2 頁:1 2 

蓋世汽車網



相關閱讀:
Nuance楊文弘專訪:滑行輸入法將成主流 2010-12-22
Nuance新推“龍游戲語音包” 語音識別操作游戲 2010-12-10
Nuance進軍中國語音識別市場 2010-10-25
NUANCE T9 Trace中文滑行輸入發(fā)布 2010-10-14
Nuance:語音識別技術引領呼叫中心全新客戶體驗 2010-09-30

熱點專題:  語音合成TTS 語音識別ASR