首頁(yè)>>廠商>>語(yǔ)音識(shí)別與合成>>捷通華聲

捷通華聲語(yǔ)音技術(shù)產(chǎn)品在SP增值業(yè)務(wù)的應(yīng)用

2006/09/19

  在以語(yǔ)音服務(wù)為主的增值業(yè)務(wù)中,需要與用戶(hù)交互大量的、豐富多彩的語(yǔ)音信息,單純的錄音不能及時(shí)滿足用戶(hù)多樣的需求,多層次的菜單和復(fù)雜的操作流程也使用戶(hù)感到厭煩。

  而語(yǔ)音合成和語(yǔ)音識(shí)別技術(shù)的應(yīng)用,避免語(yǔ)音交互過(guò)程中的繁瑣,提供一種便捷的交互方式,提高互動(dòng)的動(dòng)態(tài)性、時(shí)效性、簡(jiǎn)單性和娛樂(lè)性。

  北京捷通華聲語(yǔ)音技術(shù)有限公司一直在語(yǔ)音應(yīng)用方面進(jìn)行著探索,其語(yǔ)音技術(shù)產(chǎn)品廣泛應(yīng)用在移動(dòng)、聯(lián)通、電信等國(guó)內(nèi)各大運(yùn)營(yíng)商語(yǔ)音服務(wù)平臺(tái)中,充分顯示出在語(yǔ)音技術(shù)上的最高專(zhuān)業(yè)水平。

  捷通華聲語(yǔ)音技術(shù)產(chǎn)品

  語(yǔ)音合成產(chǎn)品

  語(yǔ)音合成(Text-to-Speech),簡(jiǎn)稱(chēng)TTS,學(xué)名文語(yǔ)轉(zhuǎn)換系統(tǒng),是指利用計(jì)算機(jī)將任意組合的文本信息轉(zhuǎn)化為聲音數(shù)據(jù),并通過(guò)聲卡、電話語(yǔ)音卡等多媒體設(shè)備將聲音輸出。

  捷通華聲自主知識(shí)產(chǎn)權(quán)的中文語(yǔ)音合成技術(shù)jTTS,采用大規(guī)模真實(shí)錄音的語(yǔ)音庫(kù)和基于韻律層級(jí)匹配的波形拼接算法,確保合成的高清晰度和高自然度,在國(guó)際上處于領(lǐng)先地位,并已申請(qǐng)多項(xiàng)國(guó)家專(zhuān)利。新近推出的jTTS4.5,基于深度的開(kāi)發(fā)和廣泛的實(shí)踐積累,在語(yǔ)料設(shè)計(jì)、韻律層級(jí)分析、語(yǔ)義分析、數(shù)字符號(hào)讀法等多項(xiàng)技術(shù)上均有突破創(chuàng)新,自然度、可懂度、流暢度也明顯提升;同時(shí)增添了更加多樣化的音色選擇,以滿足電信增值服務(wù)平臺(tái)個(gè)性化應(yīng)用的需求。

  語(yǔ)音識(shí)別產(chǎn)品

  語(yǔ)音識(shí)別(Open Speech Recognition),簡(jiǎn)稱(chēng)OSR,它的基本功能是對(duì)用戶(hù)說(shuō)話的音波進(jìn)行處理,轉(zhuǎn)換成文本,簡(jiǎn)單的說(shuō)就是讓計(jì)算機(jī)“聽(tīng)”懂人說(shuō)話。

  在電信增值業(yè)務(wù)中,信息內(nèi)容的索引作為詞條放入詞表,用戶(hù)利用這些索引獲得具體的信息內(nèi)容服務(wù),這也是目前語(yǔ)音識(shí)別技術(shù)基于電話網(wǎng)最常用的方式。

  捷通音效平臺(tái)——變音技術(shù)產(chǎn)品

  變音軟件,是捷通華聲開(kāi)發(fā)的一套聲音處理的軟件開(kāi)發(fā)包,通過(guò)數(shù)字信號(hào)處理等核心技術(shù),可以將輸入的聲音變換成另一種效果的聲音,將聲音變換出豐富多彩的效果。例如:將溫柔的女子的聲音變成粗獷的男子的聲音;將成年人的聲音變成小孩的聲音;山谷的回聲;和預(yù)先錄制好聲音混合,創(chuàng)造出波濤洶涌的海邊,嘈雜的街道,充滿蚊蟲(chóng)野外等場(chǎng)景。

  語(yǔ)音技術(shù)在語(yǔ)音增值業(yè)務(wù)中的應(yīng)用過(guò)程

  捷通華聲語(yǔ)音技術(shù)在電信增值業(yè)務(wù)中的應(yīng)用

  語(yǔ)音短信

  語(yǔ)音合成(TTS)技術(shù)在短信業(yè)務(wù)中的應(yīng)用方式主要是:通過(guò)在平臺(tái)上添加安裝語(yǔ)音合成服務(wù)器等短信平臺(tái)改造或升級(jí),用戶(hù)在使用短信時(shí),可以選擇短信發(fā)送及接收方式,如文字短信、聲音短信等,這樣,傳統(tǒng)的“看”短信就變成“聽(tīng)”短信,人們即使在很不方便用手機(jī)的狀態(tài)下(如開(kāi)車(chē)時(shí)等),也可以從容的使用單一或任意一個(gè)按鍵,或使用耳機(jī)聽(tīng)取聲音短信或話音。

  語(yǔ)音郵件

  傳統(tǒng)電話接收E-mail方法是由話務(wù)員把郵件的內(nèi)容直接念給用戶(hù)聽(tīng),而利用TTS技術(shù),由語(yǔ)音合成平臺(tái)把文本格式的郵件內(nèi)容合成為語(yǔ)音,通過(guò)IVR播放給用戶(hù)。

  用電話發(fā)E-mail業(yè)務(wù)是指用戶(hù)通過(guò)電話接入系統(tǒng),告知系統(tǒng)目的電子郵件的地址及郵件內(nèi)容,由OSR自動(dòng)識(shí)別系統(tǒng)內(nèi)已定義好的IP地址,通過(guò)IVR節(jié)點(diǎn)錄音的語(yǔ)音文件以附件的方式生成Email,通過(guò)Internet發(fā)送到對(duì)方的Email信箱中。這樣,大大方便了那些上網(wǎng)不方便,但又需要通過(guò)E-mail與外界聯(lián)系的朋友。

  語(yǔ)音秘書(shū)

  用戶(hù)可以播打電話根據(jù)語(yǔ)音提示直接對(duì)著電話語(yǔ)音填寫(xiě),包括用戶(hù)電話號(hào)碼、呼叫時(shí)間及事由等信息。這些信息經(jīng)過(guò)語(yǔ)音識(shí)別模塊識(shí)別,并存入數(shù)據(jù)庫(kù)中,并由應(yīng)用服務(wù)器定時(shí)查詢(xún)記事本,觸發(fā)PBX發(fā)生一次呼出事件,由IVR完成服務(wù)。

  語(yǔ)音電話簿

  語(yǔ)音電話簿旨在通過(guò)電話網(wǎng)絡(luò)和互聯(lián)網(wǎng)絡(luò),向用戶(hù)提供可以隨時(shí)獲取、永不丟失的通訊錄服務(wù)。系統(tǒng)可以提供電話、互聯(lián)網(wǎng)等多種接入方式,用戶(hù)接入系統(tǒng)以后可以使用通訊錄的聯(lián)系人條目進(jìn)行呼叫。如使用電話接入系統(tǒng),用戶(hù)可以用說(shuō)出人名的方式,比如“張三”,實(shí)現(xiàn)與該聯(lián)系人的通話。同時(shí)用戶(hù)可以通過(guò)電話,直接采用語(yǔ)音的方式對(duì)通訊錄進(jìn)行維護(hù),,整個(gè)過(guò)程由系統(tǒng)自動(dòng)響應(yīng)完成,從而免除按鍵等繁瑣的操作。語(yǔ)音識(shí)別技術(shù)用以識(shí)別用戶(hù)命令,從而實(shí)現(xiàn)自動(dòng)服務(wù)。語(yǔ)音合成技術(shù)把人名、電話號(hào)碼等大量無(wú)法用人工錄音的動(dòng)態(tài)信息處理成語(yǔ)音信息播報(bào)給用戶(hù)。

  語(yǔ)音資訊

  用戶(hù)可通過(guò)撥打特定的接入號(hào)碼,按照相應(yīng)的語(yǔ)音提示定制新聞實(shí)事、股票證券、天氣預(yù)報(bào)等語(yǔ)音信息后,由交互式語(yǔ)音業(yè)務(wù)平臺(tái)主動(dòng)向用戶(hù)發(fā)起呼叫,按照客戶(hù)的定制要求播放語(yǔ)音信息。這些語(yǔ)音信息可以先存儲(chǔ)為文本,再由TTS轉(zhuǎn)成語(yǔ)音向用戶(hù)播報(bào)。同時(shí)通過(guò)TTS、OSR技術(shù)輕松實(shí)現(xiàn)航班、公交路線、體育賽事、考試分?jǐn)?shù)、旅游景點(diǎn)、違章違規(guī)等信息的查詢(xún)。

  彩鈴

  彩鈴業(yè)務(wù)主要是讓主叫用戶(hù)發(fā)起呼叫之后接聽(tīng)一段悅耳的音樂(lè)或歌聲或一句問(wèn)候語(yǔ)。如遇到需將任意文字轉(zhuǎn)成語(yǔ)音方式時(shí),用人工錄音(或被叫用戶(hù)自己錄音)實(shí)現(xiàn)有些麻煩,并且有一定的安全性;而被叫用戶(hù)如果可以通過(guò)手機(jī)、固定電話(帶文字輸入的)、或者是在一個(gè)網(wǎng)頁(yè)上將自己準(zhǔn)備的有關(guān)文字信息放到彩鈴系統(tǒng)平臺(tái)中,經(jīng)過(guò)文字安全過(guò)濾,再選擇定制音樂(lè)等,彩鈴系統(tǒng)平臺(tái)中如果又安裝了語(yǔ)音合成(TTS)軟件,以上所提到的應(yīng)用就完全可以實(shí)現(xiàn)。

  另外,捷通華聲公司利用語(yǔ)音技術(shù)對(duì)一些語(yǔ)音文件進(jìn)行特效處理,將彩鈴做成一個(gè)帶有背景特效聲音的個(gè)性化語(yǔ)音文件,如:在一個(gè)山谷背景中,一個(gè)個(gè)性化的聲音在告訴你一些信息;有一個(gè)來(lái)自宇宙太空中的聲音在與你交流;一片風(fēng)雨聲中,在向您播報(bào)天氣信息;在一段悠揚(yáng)的音樂(lè)聲中,做你自己的自我介紹等。

  聲動(dòng)點(diǎn)播

  傳統(tǒng)的點(diǎn)歌系統(tǒng),將歌曲根據(jù)歌手、主題進(jìn)行分類(lèi),由于受到電話鍵盤(pán)的限制,用戶(hù)要經(jīng)過(guò)層層的菜單引導(dǎo),聽(tīng)大量的菜單內(nèi)容后聽(tīng)到點(diǎn)播的歌曲。而引入OSR以后,用戶(hù)只要說(shuō)出歌曲名稱(chēng)或者歌手姓名就可以調(diào)出所需的歌曲。同時(shí)還可以利用TTS將歌曲名稱(chēng)合成語(yǔ)音,以便動(dòng)態(tài)添加、管理曲庫(kù),免去錄音的繁瑣工作。

  其他應(yīng)用

  體育競(jìng)猜、知識(shí)問(wèn)答、廣播節(jié)目互動(dòng)、趣味游戲、虛擬博彩、交友聊天、電話廣告、民意調(diào)查、費(fèi)用催繳、愛(ài)心熱線、全國(guó)農(nóng)業(yè)信息查詢(xún)… …

  捷通華聲公司作為一家專(zhuān)業(yè)的語(yǔ)音技術(shù)公司,不僅擁有語(yǔ)音技術(shù)研究與經(jīng)驗(yàn)豐富的開(kāi)發(fā)團(tuán)隊(duì),還投資建設(shè)了國(guó)內(nèi)一流的語(yǔ)音錄音室,從而構(gòu)成了包括由專(zhuān)業(yè)人員 、專(zhuān)業(yè)設(shè)備、專(zhuān)業(yè)處理軟件技術(shù)組成的一整套語(yǔ)音資源建設(shè)體系,能夠根據(jù)不同用戶(hù)提出的任何個(gè)性化語(yǔ)音服務(wù)的需求做出迅速反應(yīng),并及時(shí)為其提供“量身定做”的語(yǔ)音產(chǎn)品,包括語(yǔ)音定制服務(wù)、各種專(zhuān)業(yè)錄音、語(yǔ)音音庫(kù)制作、語(yǔ)音加工處理等項(xiàng)目。

捷通華聲公司供稿 CTI論壇編輯



相關(guān)鏈接:
捷通華聲發(fā)布jASR5.5 ASR價(jià)格面前將無(wú)怯步 2008-04-16
捷通華聲TTS成功登陸中國(guó)郵政儲(chǔ)蓄銀行 2008-04-03
捷通華聲 jTTS 5.5 全面支持 MRCPv2標(biāo)準(zhǔn) 2008-03-31
捷通華聲移動(dòng)導(dǎo)航HCI解決方案廣受青睞 2008-03-26
身邊的“智能”生活 2007-12-28

相關(guān)頻道:  移動(dòng)增值_與_移動(dòng)  移動(dòng)增值_與_語(yǔ)音合成TTS  移動(dòng)_與_語(yǔ)音合成TTS
石门县| 岑溪市| 洞口县| 东兴市| 固镇县| 罗甸县| 富宁县| 南华县| 城口县| 新干县| 开鲁县| 陕西省| 永胜县| 塔河县| 汶川县| 神木县| 政和县| 霍山县| 进贤县| 二连浩特市| 延庆县| 澜沧| 古蔺县| 扬中市| 都兰县| 科技| 铜川市| 金阳县| 醴陵市| 石家庄市| 中江县| 江西省| 章丘市| 广丰县| 延吉市| 汶川县| 青岛市| 喀什市| 平陆县| 岳西县| 钟山县|