首頁>>廠商>>語音識別與合成>>科大訊飛

科大訊飛新一代語音合成系統(tǒng)Interphonic6.0

2010/02/04

InterPhonic系列簡介

  InterPhonic 系列產(chǎn)品是業(yè)界頂尖級的語音合成軟件產(chǎn)品。語音合成(Text To Speech,TTS)技術(shù)能夠自動將任意文字實時轉(zhuǎn)換為連續(xù)的自然語音,是一種能夠在任何時間、任何地點,向任何人提供語音信息服務(wù)的高效便捷手段,非常符合信息時代海量數(shù)據(jù)、動態(tài)更新和個性化查詢的需求。科大訊飛語音技術(shù)歷經(jīng)20年不懈創(chuàng)新,自90年代中期以來,在歷次的國內(nèi)國外評測中,各項關(guān)鍵指標(biāo)均名列第一。InterPhonic 產(chǎn)品基于深厚的研究積累,經(jīng)過長期廣泛深入的應(yīng)用實踐,在多項關(guān)鍵技術(shù)上有重大創(chuàng)新突破,作為科大訊飛引領(lǐng)語音技術(shù)與市場發(fā)展的新一代主流語音合成產(chǎn)品,可為自助語音服務(wù)提供源源不斷的核心動力。

InterPhonic 6.0產(chǎn)品介紹

  高質(zhì)量的語音合成效果


  提供普通話、廣東話、英語、法語、德語、葡萄牙語、意大利語、荷蘭語、西班牙語、瑞典語、挪威語、丹麥語、俄語、希臘語、朝鮮語、日本語等幾十個語種,包含業(yè)界創(chuàng)新的普通話與英語同音混讀、廣東話與英語同音混讀,適應(yīng)不同語音應(yīng)用業(yè)務(wù)的需求。多引擎管理接口可對不同語種的系統(tǒng)提供一致化的訪問界面,應(yīng)用層可以靈活透明的選擇所需的語音合成語種,并支持實時語種切換。


  主導(dǎo)個性化語音服務(wù)新潮流,提供豐富、風(fēng)格多樣化的音色選擇,如渾厚淳正的男聲,成熟穩(wěn)重、輕快活潑、或溫柔甜美的女聲,標(biāo)準(zhǔn)地道的英語女聲,甚至童聲、少男、少女、老年人等等,所有音色庫均繼承科大訊飛語音合成技術(shù)一貫的優(yōu)良品質(zhì)?晒┯脩舾鶕(jù)不同應(yīng)用業(yè)務(wù)需要,選擇最適合應(yīng)用場景的語音風(fēng)格,并支持實時動態(tài)的音色切換。


  InterPhonic產(chǎn)品擁有高智能的自然語言理解能力,自動進行文本分析和韻律描述,可以表現(xiàn)出典型的語氣,如疑問和感嘆等,合成效果更富表現(xiàn)力。語音合成效果對于語氣的表現(xiàn)能力,是科大訊飛語音技術(shù)又一項重要的創(chuàng)新性突破,將幫助自動語音服務(wù)以更加人性化的語音用戶界面提升客戶體驗。


  InterPhonic語音合成產(chǎn)品所擁有的高準(zhǔn)確度智能文本分析與預(yù)處理技術(shù),有效保障語音合成準(zhǔn)確、流暢、自然。得益于科大訊飛在語言學(xué)上的深厚積累、與相關(guān)權(quán)威科研機構(gòu)的緊密合作,以及通過寬廣的應(yīng)用實踐平臺所積累的海量專業(yè)知識庫,通過不斷訓(xùn)練和優(yōu)化,InterPhonic即使在面對針對語言分析處理的難點,如多音字、特殊符號、韻律短語、未登錄詞(如地名、人名)等等,也能保障得到高度準(zhǔn)確的自動處理結(jié)果。


  針對主流應(yīng)用環(huán)境的普遍需求,科大訊飛廣泛收集實際應(yīng)用的語料,并進行細致分析和專業(yè)的優(yōu)化,InterPhonic產(chǎn)品在數(shù)字數(shù)值、短語短句等最常見應(yīng)用下效果提升顯著,合成效果更加清晰準(zhǔn)確、節(jié)奏感更強。

  全面完善的功能特性


  采用基于TCP/IP的高效網(wǎng)絡(luò)語音合成服務(wù)和集中式的資源管理機制,形成客戶端-資源管理器-服務(wù)器有機結(jié)合的體系架構(gòu),構(gòu)建可靈活伸縮的方案,其高可用性歷經(jīng)眾多重點行業(yè)大規(guī)模關(guān)鍵業(yè)務(wù)的應(yīng)用檢驗,確保提供值得信賴的7×24小時不間斷自動化語音服務(wù)。


  InterPhonic SDK針對不同開發(fā)工具,不同集成要求和方案,提供多種形式的開發(fā)接口,包括:標(biāo)準(zhǔn)開發(fā)接口(DLL)、簡單開發(fā)接口、COM組件、SAPI開發(fā)接口及Java開發(fā)接口,開發(fā)者可以根據(jù)實際需要靈活選擇。提供豐富的開發(fā)例程和文檔,幫助加速語音應(yīng)用開發(fā)過程。


  豐富完善的參數(shù)設(shè)置與調(diào)節(jié)功能和工具,幫助用戶對語音合成效果進行靈活高效的控制與管理。提供對全局參數(shù)(如音量、語速、音高等)、用戶詞典、用戶規(guī)則、定制資源包統(tǒng)一進行配置和管理的工具;數(shù)字、標(biāo)點符號、英文發(fā)音方式的設(shè)定;中英文加詞功能,可以指定每個字詞的拼音或音標(biāo)等等;提供統(tǒng)一的簡單易用圖形化用戶界面進行操作設(shè)定,并可通過API參數(shù)進行動態(tài)設(shè)置和調(diào)整,還支持以CSSML(中文語音合成標(biāo)記語言)進行標(biāo)記、描述和控制。


  InterPhonic的增強工具集套件包括了使用便捷的高效組件,如離線語音應(yīng)用工具、CSSML可視化編輯工具、DOC/XLS文本格式轉(zhuǎn)換工具等。


  能夠解析普通文本格式、MIME格式和html格式的Email,合成郵件主題、發(fā)件人、收件人、信件內(nèi)容和文本附件,根據(jù)語境自動判斷讀法。


  增加了URI合成功能。自動獲取用戶指定的網(wǎng)絡(luò)URI文本,方便使用網(wǎng)絡(luò)上的信息資源。


  全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE編碼字符集,自動識別UNICODE文本;支持直接輸出多種采樣率的語音數(shù)據(jù)格式(包括6K/8K/11K/16K)的線性Wav、A/U率Wav和Vox等多種格式的語音數(shù)據(jù)。


  服務(wù)器端支持Windows等主流操作系統(tǒng),客戶端支持Microsoft Windows、SUN Solaris、REDHAT Linux、SUSE Linux、HP TRUE64 UNIX、IBM AIX UNIX、VxWork等操作系統(tǒng)。


  與業(yè)內(nèi)知名的相關(guān)平臺和設(shè)備商均有過成功的集成案例。通過與眾多平臺和設(shè)備提供商、系統(tǒng)集成商及軟件開發(fā)商的緊密合作,能夠保證向用戶提供圍繞語音應(yīng)用全程的專業(yè)服務(wù)。

  細致周到的優(yōu)化方案


  提供以定制資源包(加載于合成引擎之上,有效提升既定應(yīng)用領(lǐng)域語音效果的資源集合)、CSSML、虛擬不定長和語音合成模板等工具為代表的主流應(yīng)用環(huán)境進行效果優(yōu)化的高效解決方案,顯著提升實際應(yīng)用效果?拼笥嶏w專業(yè)服務(wù)體系提供高效的定制與優(yōu)化方案,提升客戶體驗,幫助客戶獲得語音自助服務(wù)的持續(xù)成功。


  CSSML(Chinese Speech Synthesis Markup Language)是由科大訊飛提出并牽頭制訂的中文語音數(shù)據(jù)描述規(guī)范。該標(biāo)準(zhǔn)得到了國家863專家組、國家信標(biāo)委和國家技術(shù)監(jiān)督局的大力關(guān)注與支持,2005年正式通過國家標(biāo)準(zhǔn)化組織的評審,成為中文語音合成技術(shù)標(biāo)準(zhǔn)與規(guī)范的重要內(nèi)容。CSSML針對中文語音應(yīng)用設(shè)計和擴展,可以對多種特性進行靈活標(biāo)注與控制,并與SSML兼容。


  InterPhonic提供業(yè)界創(chuàng)新的預(yù)錄音統(tǒng)一管理功能,將預(yù)錄音作為語音合成系統(tǒng)的資源,并通過提示音智能匹配和合成模板等方式使預(yù)錄音與合成音匹配更加容易、銜接更加流暢,同時避免頻繁處理提示音播放與語音合成的切換與過渡問題,簡化應(yīng)用流程的復(fù)雜程度,進一步提高服務(wù)效果與質(zhì)量。


  InterPhonic提供業(yè)界首創(chuàng)的背景音功能,通過系統(tǒng)提供的簡單易用工具,可以便捷高效的添加背景音樂,調(diào)整背景音樂和合成語音的音量對比,并可直接試聽實際效果,使語音服務(wù)更加親切自然。

  作為語音市場的強大動力引擎,InterPhonic產(chǎn)品會為您帶來如下收益:

  降低成本:高質(zhì)量的效果、靈活的應(yīng)用、經(jīng)過應(yīng)用驗證的穩(wěn)定性,可使您放心自如地應(yīng)用自助語音服務(wù)來取代傳統(tǒng)的人工服務(wù)。更高的自動化程度,意味著您將以更低的成本提供更高質(zhì)量的服務(wù)。

  提高效率:有利于改變原有的語音信息制作方式,在規(guī)模語音應(yīng)用系統(tǒng)中,多路并發(fā)的實時語音合成服務(wù),將顯著提高信息更新的時效性,并且提供的語音信息內(nèi)容與范圍將得以大大拓展。

  靈活擴展:標(biāo)準(zhǔn)Client/Server架構(gòu)以及完善的系統(tǒng)設(shè)計,充分考慮了大規(guī)模語音應(yīng)用的需求,具備良好的伸縮性。擴容時只需增加新的語音合成服務(wù)節(jié)點,無需對原有系統(tǒng)進行其它改動。

  實力保障:科大訊飛堅實的綜合實力、高效的專業(yè)研發(fā)和技術(shù)支持服務(wù)團隊、業(yè)界公認的領(lǐng)導(dǎo)者地位以及所獲得的廣泛贊譽,都是您得到穩(wěn)定支持服務(wù)的有力保障。

InterPhonic 6.0在線演示

CTI論壇編輯



相關(guān)閱讀:
訊飛助安徽電力95598呼叫中心語音系統(tǒng)完美升級 2010-02-02
訊飛語音助氣象預(yù)警系統(tǒng) 提升農(nóng)村防御災(zāi)害能力 2010-01-28
訊飛語音技術(shù)助力航空港科技發(fā)展 2010-01-27
科大訊飛有聲播報讓互聯(lián)網(wǎng)開口說話 2010-01-25
科大訊飛開發(fā)暢言互動英語教師版系統(tǒng) 2010-01-21

贵德县| 建始县| 馆陶县| 皋兰县| 桑植县| 齐齐哈尔市| 冷水江市| 涟源市| 南漳县| 长武县| 镇宁| 岱山县| 新邵县| 土默特左旗| 军事| 湄潭县| 集贤县| 辉南县| 乌海市| 长岛县| 闻喜县| 呼图壁县| 嘉善县| 苏尼特左旗| 德阳市| 永清县| 新乡市| 高要市| 鲁甸县| 莱西市| 麟游县| 基隆市| 金堂县| 建宁县| 攀枝花市| 习水县| 鄂尔多斯市| 平度市| 嘉鱼县| 谷城县| 白河县|