靈云科技15日消息:捷通華聲宣布推出最新嵌入式靈云語音合成技術--iHear 7.1,全面優(yōu)化吐字發(fā)音,實現(xiàn)不同音庫語音合成器的定制,中文發(fā)音流暢自然,英文發(fā)音甜美動聽,中英混讀更加平滑自然,語音合成效果大幅提升,全面超越目前市場的同類產品,嵌入式語音合成技術達到國內頂尖水平。

經過在語音合成領域十多年技術研究與產業(yè)應用,捷通華聲靈云語音合成技術的合成效果受到廣大合作伙伴的高度肯定,在國家經濟建設中的得到了廣泛應用,從金融、通信、交通、CTI、能源、政務辦公、醫(yī)療、教育等領域的語音廣播系統(tǒng),到智能手機、智能車載、智能家居、家電、智能機器人等領域的語音交互,靈云語音合成技術已深深的滲透到人民生活中,無處不在、無時不在地為億萬社會大眾提供穩(wěn)定、優(yōu)質、便捷的語音服務。
靈云語音合成技術 讓文字有聲有色
靈云語音合成技術能夠實時、準確的將文本信息轉換為自然、流暢的語音,單個音節(jié)發(fā)音干凈純正、飽滿有力,連續(xù)詞組發(fā)音真實準確、韻律自然,整體句子朗讀效果清晰流暢、抑揚頓挫、富有表現(xiàn)力,達到真人播音員發(fā)音般的效果,可在靈云平臺(hcicloud.com)體驗語音合成效果。靈云語音合成技術優(yōu)秀的合成效果,是捷通華聲憑借對漢語語音合成技術以及漢語韻律知識的獨特認知,基于大規(guī)模真實錄音音庫的波形算法和對漢語韻律特征建模并在多項關鍵技術上取得重大創(chuàng)新突破取得的研究成果,在十多年的產業(yè)應用與積累中,靈云語音合成技術取得快速的進步并形成了其獨特的優(yōu)點:
多語種,支持中英混讀:支持中文普通話、粵語、維語、英語、日語、德語、法語等21種語言,覆蓋全球90%以上的國家和地區(qū),合成效果穩(wěn)定,中英混讀支持普通話、粵語與英語同音混讀,有效滿足中英文混合文本的語音合成需求。
多音色,個性化發(fā)音:從成熟穩(wěn)重、吐詞清晰適合新聞類播報的男聲,到干凈細膩、溫柔甜美適合高鐵、機場等場所語音播報的女聲,再到輕快活潑、聲情并茂適合講故事、聽小說的童聲,讓語音合成有聲有色,所有音庫均繼承捷通華聲語音合成技術一貫的優(yōu)良品質,全面滿足各種應用場景中多樣化的語音合成需求。
多領域音庫,發(fā)音更專業(yè):支持金融證券、天氣預報、體育賽事、公交信息、旅游餐飲、汽運、排隊叫號、名家金曲、保險、航空、稅務和電力、POI等12個領域專業(yè)詞庫、預選音音庫等,大幅提升各專業(yè)領域的語音合成效果。
音庫定制化:支持字符、詞組、句子讀音定制,也可對一些常用的英文縮寫進行中文播報,或者定義一些外部規(guī)則,為用戶提供定制化的語音合成服務。
智能文本預處理與分析:基于語言學與算法的優(yōu)化,實現(xiàn)對多音字、特殊符號、韻律短語、未登錄詞(如地名、人名)等發(fā)音的準確處理,保證語音合成效果。
支持播放打斷、停止、繼續(xù)等:支持MRCP協(xié)議,在語音合成播報過程中,支持打斷、停止、暫停、以及繼續(xù)等功能,輕松掌控語音合成播報過程。
靈云語音合成 方便易集成
捷通華聲靈云語音合成技術經過多年的產業(yè)應用與市場磨合,形成了獨特的產品形態(tài),支持Windows/Android/Linux/iOS等各種主流操作系統(tǒng),能方便的集成到各種應用與客戶業(yè)務系統(tǒng)中,以“云+端”形式為用戶提供穩(wěn)定、高效、優(yōu)質的語音合成服務。
捷通華聲推出的jTTS多語種語音合成平臺,采用開放式架構設計方法,對外可方便地與客戶業(yè)務對接,對內可掛接多音色、多語種音庫引擎,用戶既可以選擇在本地合成語音,也可以直接選擇從“云”端調用合成的語音,為用戶提供多音色、多語種的語音合成服務。如今,捷通華聲經過長期與國內金融、電信、交通、能源及CTI等各領域企業(yè)保持良好的合作伙伴關系,憑借為合作企業(yè)提供周到細致的技術服務和穩(wěn)定優(yōu)質的合成效果,捷通華聲語音合成市場占有率已超過50%,語音服務從北京奧運會到上海世博會;從縱貫中國的高鐵到各大飛機場;從建行、農行等各大銀行的聲訊服務到各領域的呼叫中心服務;從各個醫(yī)院語音叫號到各地長途汽車站廣播系統(tǒng),可以說,從2000年到今天,捷通華聲的靈云語音合成技術無時無刻、無處不在地為中國億萬大眾提供最先進的語音合成服務。
為了滿足市場上各種智能設備對離在線融合的語音合成解決方案的需求,捷通華聲推出了小巧易“嵌入”的靈云語音合成引擎,目前已升級到iHear7.1,音庫資源占用大小僅為8M,可以封裝到SDK便捷地集成到各種應用中,已在智能手機、智能車載、智能家居、家電、智能機器人等領域得到了廣泛的應用,并憑借其友好自然的聲音與易集成的特點得到了廣大合作伙伴的高度肯定,為用戶提供“云+端”形式的語音合成服務,實現(xiàn)無網絡狀況下的“0”流量的優(yōu)質語音體驗。
結合靈云語音識別技術,靈云語音合成技術在靈云智能語音導航系統(tǒng)、靈云智能客服機器人等產品中得到了大量的應用,靈云智能語音導航系統(tǒng)、靈云智能客服機器人能以語音交互形式在電話端為用戶提供便捷的業(yè)務查詢、業(yè)務咨詢以及業(yè)務辦理等服務,有效減少企業(yè)客戶服務成本,大幅提高客戶服務效率,全面提升用戶服務體驗。
捷通華聲 中國智能語音領軍企業(yè)
北京捷通華聲語音技術公司創(chuàng)建于2000年,是國內最早從事中文語音合成(TTS)技術研究與應用的企業(yè),2001年,捷通華聲推出了具有國際領先水平的TTS世紀版,是國內第一項基于大容量真實錄音庫和韻律層級分析技術的語音合成技術,在自然度和流暢度上達到了一個嶄新的水平,標示著中國中文語音合成技術開始進入商品實用化階段。如今,捷通華聲中文語音合成(TTS)技術在國內已處于絕對領先地位,在語音合成市場占有率超過50%。十多年來,捷通華聲始終堅持自主研究語音合成(TTS)、語音識別(ASR)、語義理解(NLU)等智能語音技術,并不斷推出粵語、維吾爾語等方言與少數民族語音合成技術,為保證我國中文智能語音技術始終處于世界領先地位做出了主要貢獻,也成為推動語音合成技術在CTI、智能設備等領域中廣泛應用的主要力量。
2014年,捷通華聲憑借在智能語音產業(yè)界所做出的貢獻與絕對領先的智能語音技術能力,在“第六屆中國行業(yè)信息化獎項評選活動”上一舉奪得“中國智能語音產業(yè)領軍企業(yè)大獎”,成為智能語音產業(yè)中第一個獲得此項殊榮的企業(yè)。
2015年,捷通華聲在靈云語音合成,語音識別的基礎上,推出了靈云聲紋識別、靈云智能語音導航、智能語音分析系統(tǒng),以及靈云朗讀軟件VoiceReader(PC端軟件,可在靈云平臺hcicloud。com下載)等一系列的優(yōu)秀語音產品與解決方案,靈云智能語音技術通過服務百度導航、搜狗導航、導航犬、嘀嘀打車、快的打車、易到用車、天行聽書、靈云智能輸入法、觸寶輸入法等家喻戶曉的移動應用服務,及京東商城、攜程網、去哪兒網等大型互聯(lián)網平臺,使億萬社會大眾充分感受并體驗到智能語音等人工智能技術為現(xiàn)代生活所帶來的輕松與便捷。
聯(lián)合清華大學 全面推動中國人工智能產業(yè)發(fā)展
2011年,捷通華聲創(chuàng)造性推出了全球第一個最大、最全的人工智能技術開放平臺-靈云平臺(hcicloud.com),自靈云平臺創(chuàng)建以來,捷通華聲就擔負起將智能語音、智能圖像、語義理解、生物特征識別等人工智能技術實現(xiàn)產業(yè)化應用的企業(yè)之責,從最早推出靈云語音合成(TTS)、靈云手寫識別(HWR),至靈云語音識別(ASR)、靈云聲紋識別(VPR)、靈云人臉識別(AFR)、光學字符識別(OCR)、指紋識別(FPR)、自然語言理解(NLU)、機器翻譯(MT)等全方位的人工智能技術,捷通華聲一直堅定務實地走中國人工智能技術產業(yè)化道路。捷通人的努力,讓這些無論是當時還是現(xiàn)在都是“高精尖”的人工智能技術距離產業(yè)與大眾不再“高深莫測”,更不是遙不可及,更讓大眾真正的體驗到人工智能技術為工作、生活所帶來的巨大便捷。
2013年,捷通華聲與清華大學旨在實現(xiàn)“靈云科技 源自清華”的戰(zhàn)略合作,相繼創(chuàng)建清華靈云人工智能研究中心、清華海峽研究院人工智能研究中心,共同致力于推動中國人工智能產業(yè)的發(fā)展。捷通華聲與清華大學的戰(zhàn)略合作,使靈云平臺“如虎添翼”,歷經數年發(fā)展,靈云已成為中國人工智能領域最大最全也最具影響力的云服務平臺,成功推動中國人工智能產業(yè)進入云服務時代,2015年,捷通華聲憑借靈云全方位人工智能技術的領先優(yōu)勢與在中國人工智能產業(yè)中影響力,被產業(yè)內評為“中國人工智能產業(yè)領軍企業(yè)”。
伴隨人工智能產業(yè)在世界范圍內的高速發(fā)展,捷通華聲將繼續(xù)以清華大學人工智能研究力量為依托,更加專注人工智能技術研究與產業(yè)化應用,與產業(yè)內合作伙伴精誠合作,共同創(chuàng)建良好的人工智能產業(yè)生態(tài),共同推動中國人工智能產業(yè)的發(fā)展進步,為中國人工智能產業(yè)在世界范圍內的崛起做出應有的貢獻!