近年來,人工智能行業(yè)快速發(fā)展,智能語音市場也異;馃。無論是BAT、網(wǎng)易等互聯(lián)網(wǎng)大廠,還是以訊飛為首的人工智能大企業(yè),亦或者近些年在AI賽道上異軍突起的中小企業(yè),都在用開放平臺的戰(zhàn)略方式,試圖籠絡各開發(fā)者,建立屬于自己的AI產(chǎn)業(yè)生態(tài)圈。
據(jù)相關數(shù)據(jù)統(tǒng)計,國內(nèi)智能語音相關開放平臺已有50多家,其中不乏垂直領域的技術型小公司。標貝科技作為一家深耕智能語音領域中小企業(yè),在2021年4月6日,也正式宣布加入智能語音開放平臺“大軍”,進一步推動人工智能語音場景落地,全效助力開發(fā)者構建自身AI語音生態(tài)。

據(jù)了解,標貝開放平臺匯集了標貝科技五年以來在智能語音領域取得的相關技術成果,以豐富的商業(yè)化AI語音能力、個性化效果,為開發(fā)者提供業(yè)界領先的人機對話技術調(diào)用,能快速解決開發(fā)者在語音交互相關技術開發(fā)難點、痛點問題,提高開發(fā)者智能化產(chǎn)品落地速度,大大節(jié)省其開放成本和時間。
兩大服務,提升交互體驗
目前,標貝開放平臺提供的智能語音服務主要包括語音合成(TTS)與語音識別(ASR),開發(fā)者可以在平臺操作界面創(chuàng)建多個智能語音應用,系統(tǒng)自動分配了語音識別和語音合成的全部服務到該應用。語音識別包括一句話識別、長語音識別、錄音文件識別,語音合成可選擇在線合成、離線合成、長文本合成三種,并可根據(jù)客戶自身需求進行用量、音色、并發(fā)等接入試用。特別值得一提的是,離線引擎的開放,使標貝對智能電視等嵌入式設備廠商的服務更為全面。
在語音合成方面,標貝采用基于transfomer機制的高音質(zhì)合成,綜合利用聲學和語言學參數(shù),多音字的合成準確率更高,韻律停頓更加自然,整體的語音聽感體驗更接近場景化的真人表達。合成的接口全面支持多音字標注,手動校對發(fā)音,語速停頓調(diào)節(jié)等通用功能。語音識別方面,基于先進的端到端的深度學習算法,聚焦中文普通話近場識別,在安靜環(huán)境下近字準確率超過97%。除了支持16k的設備端交互,還支持8k的客服場景電話語音識別。并支持通過熱詞更新方式,進行領域內(nèi)特定詞識別效果的快速優(yōu)化。
全音庫開放,支持多應用場景
標貝開放平臺發(fā)布后將開放近60個音色,涵蓋老人、兒童、青年男女音。每一種音色均使用海量音頻數(shù)據(jù)訓練而成,聲音真實飽滿、富有表現(xiàn)力,MOS評分達到業(yè)內(nèi)領先水準。同時,平臺支持中文、英文、中英混合、方言和多語種發(fā)音,可滿足教育、新聞、有聲閱讀、泛娛樂等領域語音定制需求,并支持多語言、多情感同時使用。

簡單兼容,賦能開發(fā)者
與目前主流智能語音開放平臺相同,標貝開放平臺提供WEBAPI調(diào)用,Android、iOS等平臺SDK接入方式,平臺基于B/S架構的管理平臺,使開發(fā)者可根據(jù)需求同時創(chuàng)建多個應用,支持千萬級并發(fā),每個應用有獨立的可視化數(shù)據(jù)統(tǒng)計,幫助開發(fā)者實時、精確地監(jiān)測應用服務調(diào)用情況。
與此同時,標貝開放平臺設有應用預警功能,通過預警管理,開發(fā)者可對調(diào)用頻次、剩余用量、并發(fā)量和有效期限等使用狀態(tài)進行設置,實現(xiàn)精細化管理。來自標貝科技的數(shù)據(jù)顯示,該平臺語音合成和語音識別的速度均達到行業(yè)領先水平,服務可靠性高達99.9%。
除此之外,標貝開放平臺非常注重交互感,無論是UI界面還是功能體驗,都比較人性化,是目前最簡單且最兼容的智能語音交互平臺之一,致力于讓各位開發(fā)者,使用方便、效率翻倍。
對于智能語音服務平臺的上線,標貝開放平臺相關負責人表示,“憑借在基礎業(yè)務AI數(shù)據(jù)服務的長期積累,以及不斷創(chuàng)新的技術研發(fā)投入,標貝科技智能語音交互技術已達到業(yè)內(nèi)領先水平,希望通過標貝語音服務開放平臺賦能各行業(yè),共同開創(chuàng)更多語音交互場景,實現(xiàn)開放共贏。”據(jù)悉,標貝開放平臺新注冊的會員,可獲得一定量的無限期免費服務及優(yōu)惠。