首頁(yè)>>廠商>>語(yǔ)音識(shí)別與合成>>科大訊飛

科大訊飛再推新版語(yǔ)音合成系統(tǒng),支持Unix和Linux操作系統(tǒng)

2004/09/20

  科大訊飛早在2003年上半年就率先推出了基于Unix和Linux兩個(gè)操作環(huán)境下的語(yǔ)音合成系統(tǒng),填補(bǔ)了國(guó)內(nèi)語(yǔ)音技術(shù)在這方面的技術(shù)空白。近期,科大訊飛又在此基礎(chǔ)上開(kāi)發(fā)出了基于最新語(yǔ)音合成產(chǎn)品Intephonic3.0的Unix和Linux版本,兩個(gè)版本在上月同時(shí)發(fā)布。

  語(yǔ)音合成技術(shù)(即Text To Speech)能夠自動(dòng)將任意文字信息實(shí)時(shí)轉(zhuǎn)換為連續(xù)的語(yǔ)音,是一種能夠在任何時(shí)間、任何地點(diǎn)向任何人提供語(yǔ)音信息服務(wù)的高效便捷手段,非常符合信息時(shí)代海量數(shù)據(jù)、動(dòng)態(tài)更新和個(gè)性化查詢的需求。

  面對(duì)不斷增長(zhǎng)的市場(chǎng)需求,語(yǔ)音合成技術(shù)在近幾年不斷向縱深方向發(fā)展,中英文的合成效果可以跟真人發(fā)音相媲美,這種用合成系統(tǒng)自助服務(wù)的方式也已經(jīng)開(kāi)始受到人們的歡迎。然而,國(guó)內(nèi)語(yǔ)音合成產(chǎn)品比較單一,其最明顯的一點(diǎn)便是不能支持Windows以外的操作系統(tǒng),這勢(shì)必造成某些領(lǐng)域在應(yīng)用推廣時(shí)受到限制。同時(shí),由于部分行業(yè)企業(yè)用戶出于實(shí)際應(yīng)用環(huán)境的考慮,或者為了追求更高的系統(tǒng)穩(wěn)定性,而選擇了Unix和Linux這兩大操作系統(tǒng),因此,在不斷提高語(yǔ)音合成效果的同時(shí),如何滿足眾多開(kāi)發(fā)者對(duì)多樣化應(yīng)用環(huán)境的需求,已經(jīng)成為至關(guān)重要的突破口了。

  此次發(fā)布的unix和linux版繼續(xù)延伸了科大訊飛語(yǔ)音技術(shù)優(yōu)勢(shì),覆蓋高端行業(yè)用戶需求的理念,在原有的2.0版本上增添了不少新特性:

  • 多種音庫(kù),滿足不同應(yīng)用環(huán)境下的個(gè)性化需求:適應(yīng)語(yǔ)音信息服務(wù)從簡(jiǎn)單信息發(fā)布向綜合資訊及娛樂(lè)和互動(dòng)體驗(yàn)等多樣化應(yīng)用擴(kuò)展的趨勢(shì),InterPhonic 3.0同時(shí)提供清脆甜美與平穩(wěn)正式兩種風(fēng)格的語(yǔ)音選擇,支持在系統(tǒng)運(yùn)行狀態(tài)下的自由風(fēng)格切換,根據(jù)具體應(yīng)用業(yè)務(wù)的需要,選擇最適合語(yǔ)音風(fēng)格,使整個(gè)語(yǔ)音應(yīng)用給用戶帶來(lái)更加自然貼切的感受。


  • 背景音樂(lè),快速便捷提升用戶體驗(yàn)的高效手段:實(shí)際應(yīng)用證明,在合成語(yǔ)音或提示音中適當(dāng)添加背景音樂(lè),可以有效改善用戶實(shí)際應(yīng)用過(guò)程中的體驗(yàn),使語(yǔ)音服務(wù)更加的親切自然。InterPhonic 3.0實(shí)現(xiàn)了背景音樂(lè)與合成語(yǔ)音的自動(dòng)融合。使用系統(tǒng)提供的工具,可以便捷高效的添加背景音樂(lè),調(diào)整背景音樂(lè)和合成語(yǔ)音的音量對(duì)比,并可直接試聽(tīng)實(shí)際效果。


  • 預(yù)錄語(yǔ)音,一致化管理處理流暢銜接簡(jiǎn)化應(yīng)用:預(yù)錄語(yǔ)音與合成語(yǔ)音結(jié)合提供語(yǔ)音服務(wù)的應(yīng)用中,通過(guò)InterPhonic 3.0d的預(yù)錄音的統(tǒng)一管理功能,將預(yù)錄音作為語(yǔ)音合成系統(tǒng)的資源,可以使預(yù)錄音與合成音銜接流暢,同時(shí)避免頻繁處理提示音播放與語(yǔ)音合成的切換與過(guò)渡問(wèn)題,簡(jiǎn)化應(yīng)用流程的復(fù)雜程度,從而進(jìn)一步提高服務(wù)效果與質(zhì)量。


  • 豐富工具,增強(qiáng)系統(tǒng)可用性縮短應(yīng)用發(fā)布周期:在致力于語(yǔ)音合成核心引擎的縱深研發(fā)和持續(xù)發(fā)展的同時(shí),科大訊飛不斷推出方便語(yǔ)音開(kāi)發(fā)與應(yīng)用的工具,旨在幫助合作伙伴和客戶快速提升語(yǔ)音應(yīng)用的效果和效率。InterPhonic 3.0的增強(qiáng)工具包套件包括了使用便捷的高效組件,如CSSML可視化編輯工具、SysthART/SynthBAT/SynthDB離線語(yǔ)音應(yīng)用工具、EasyCOM文件搬運(yùn)工和ReadWORD/ReadEXCEL文本格式轉(zhuǎn)換工具等。


  •   除上述特性和對(duì)Linxu和Unix操作系統(tǒng)的支持以外,新產(chǎn)品還整合提供多語(yǔ)言語(yǔ)音合成引擎,支持中文普通話、普通話與英語(yǔ)同音混讀、廣東話、英語(yǔ)(美式英語(yǔ)、英式英語(yǔ))等多樣化語(yǔ)種的語(yǔ)音服務(wù),不同語(yǔ)言的語(yǔ)音合成引擎通過(guò)一致化接口統(tǒng)一管理。

    作為語(yǔ)音產(chǎn)業(yè)的領(lǐng)導(dǎo)者,保證核心效果提升的同時(shí),科大訊飛不斷加大在多操作系統(tǒng)產(chǎn)品化方面的研究力度。經(jīng)過(guò)技術(shù)開(kāi)發(fā)人員數(shù)月的不懈努力,目前已成功完成將最新的InterPhonic3.0中英文混讀語(yǔ)音合成系統(tǒng)到Unix和Linux操作系統(tǒng)上的移植,并且還進(jìn)行了新應(yīng)用環(huán)境下的大壓力、多線程的穩(wěn)定性和效率測(cè)試,完全達(dá)到滿足實(shí)際應(yīng)用的需求。此次經(jīng)過(guò)移植的Unix和Linux版本語(yǔ)音合成不僅在合成效果上等同于同版本W(wǎng)indows產(chǎn)品,而且沿襲了以往的標(biāo)準(zhǔn)開(kāi)發(fā)接口, 在產(chǎn)品特性和功能方面也做到了盡可能的統(tǒng)一。。同時(shí),此次推出的interphonic 3.0 unix和linux版本對(duì)產(chǎn)品架構(gòu)作了很大改進(jìn),大大縮短了產(chǎn)品開(kāi)發(fā)的周期,并為今后的版本升級(jí)做好鋪墊。

    至此,科大訊飛語(yǔ)音合成系統(tǒng)已經(jīng)實(shí)現(xiàn)了在Windows 2000/NT、Win CE、Linux和Unix等四種操作系統(tǒng)上的應(yīng)用。在同行業(yè)中,率先使得在多種操作系統(tǒng)上的語(yǔ)音合成都能達(dá)到最優(yōu)的合成效果,其優(yōu)秀的語(yǔ)音合成效果已經(jīng)在海南、浙江、成都、上海等地的實(shí)際應(yīng)用中得到驗(yàn)證。

    科大訊飛公司供稿 CTI論壇編輯



    相關(guān)鏈接:
    訊飛暢言語(yǔ)音教具系統(tǒng)榮獲“創(chuàng)新軟件產(chǎn)品” 2009-09-08
    科大訊飛嵌入式語(yǔ)音新產(chǎn)品發(fā)布會(huì)在深圳舉行 2009-09-07
    “會(huì)說(shuō)話”的顯示屏提升居民小區(qū)信息服務(wù)水平 2009-09-07
    訊飛語(yǔ)音助力太平人壽客服中心 2009-08-28
    訊飛語(yǔ)音助力CDMA手機(jī)競(jìng)爭(zhēng)終端市場(chǎng) 2009-08-14

    分類信息:  語(yǔ)音合成TTS_與_語(yǔ)音識(shí)別ASR     新聞?lì)l道   技術(shù)_語(yǔ)音應(yīng)用_新聞   技術(shù)_語(yǔ)音應(yīng)用_新聞