
近日,標貝科技全新推出英語語音識別能力,得益于海量的數(shù)據(jù)基礎及深度學習平臺,英語語音識別的準確率得到全面提升,助推語音交互技術在更多場景的落地應用。
標貝英語語音識別詞準率達95%
人機交互主要解決如何讓機器聽得懂,并作出正確的回應,因而語言識別和自然語言處理能力尤為重要。標貝科技此次推出的英語語音識別功能完全基于標貝自研的深度神經(jīng)網(wǎng)絡訓練聲學模型進行研發(fā),通過大量英語語料數(shù)據(jù),不斷對識別模型進行優(yōu)化訓練,從而讓語音識別準確率獲得大幅提升,英語語音識別詞準率高達95%。
此外,標貝英語語音識別可以支持一句話、長語音、錄音文件三種形式的識別轉(zhuǎn)寫,同時還能根據(jù)應用場景需要,針對特定詞匯識別效果進行優(yōu)化定制,適用于不同場景下的美式英語、英式英語、中英文混合識別,提升用戶交互體驗。
打造數(shù)據(jù)工場構建10萬小時自有數(shù)據(jù)庫
眾所周知,基于機器學習的各種技術,往往都需要使用大量的數(shù)據(jù)來訓練,語音識別的準確率更是離不開算法和數(shù)據(jù)的積累。實際應用中,數(shù)據(jù)作為機器學習的基礎,很多時候數(shù)據(jù)質(zhì)量的好壞對總體性能的影響甚至超過了算法本身。斯坦福大學副教授、Coursera聯(lián)合創(chuàng)始人吳恩達,曾經(jīng)強調(diào)數(shù)據(jù)質(zhì)量對于AI的重要性:80%的數(shù)據(jù)+20%的模型=更好的AI。

因此,在當前人工智能產(chǎn)業(yè)發(fā)展進入場景應用的關鍵時期,對數(shù)據(jù)質(zhì)量提出了更高的要求。自成立起,標貝科技扎根AI數(shù)據(jù)服務領域,自研一站式數(shù)據(jù)采標平臺-數(shù)據(jù)工場,全方位支持文本、語音、圖像、視頻等各類型數(shù)據(jù)的處理,為企業(yè)客戶提供數(shù)據(jù)采集、標注等定制化數(shù)據(jù)解決方案,滿足不同行業(yè)、多類型的場景化數(shù)據(jù)需求,持續(xù)提升數(shù)據(jù)產(chǎn)能和效率。
目前,標貝科技構建了大規(guī)模、多語種的AI語音數(shù)據(jù)庫,總時長超過10萬小時。其中,自有語音識別庫超過50余種,覆蓋智能硬件、智能客服、AI教育、有聲閱讀、車載交互等多個應用場景。

*以上數(shù)據(jù)庫列表僅為部分內(nèi)容,如需完整數(shù)據(jù)庫請聯(lián)系我們
據(jù)了解,本次標貝科技推出的英語語音識別系統(tǒng)基于自有的兒童英文數(shù)據(jù)庫、美式英文朗讀與對話數(shù)據(jù)庫、英式英語數(shù)據(jù)庫、中國成人說英文數(shù)據(jù)庫、中國青少年英文數(shù)據(jù)等近萬小時的優(yōu)質(zhì)英語語音數(shù)據(jù)進行模型訓練,在深度學習神經(jīng)網(wǎng)絡算法加持下,能夠保證系統(tǒng)可以快速的輸出高準確率的識別結果。
標貝科技數(shù)據(jù)業(yè)務相關負責人表示,數(shù)據(jù)標注行業(yè)的發(fā)展已經(jīng)越來越趨向于專業(yè)化,客戶需求已經(jīng)從早期較簡單的、通用的數(shù)據(jù)過渡到更復雜的多語種、個性化的、場景化的數(shù)據(jù),對于很多細分領域,需要大量真實的模型進行標注去迭代優(yōu)化。而標貝科技基于自研的一體化采標平臺,采用人機協(xié)作的方式,推出場景化的英語語音識別能力,目的就是為了滿足不同的應用場景,讓用戶享受到更快速、更準確的英語語音識別服務。
立足業(yè)務場景 深挖AI數(shù)據(jù)應用價值
多年行業(yè)深耕,標貝科技積累了豐富的行業(yè)經(jīng)驗和案例,連續(xù)兩年入選年度數(shù)據(jù)標注公司排行榜單TOP10,助力自動駕駛、電商、智能客服、智能家居、社交娛樂、融媒體等領域頭部企業(yè)客戶智能語音交互業(yè)務上線,并獲得眾多用戶的信賴與認可。
未來,隨著人工智能、5G、IOT等技術的成熟,作為聯(lián)動各智能設備終端的關鍵通道,語音識別、語音合成等智能語音交互技術將得到更廣泛的落地應用。標貝科技將持續(xù)聚焦場景化的數(shù)據(jù)服務,在技術創(chuàng)新和場景應用的雙輪驅(qū)動之下,進一步提升人機協(xié)同的準確率和效率,為AI產(chǎn)業(yè)發(fā)展提供更多種類、更大規(guī)模、更高價值的數(shù)據(jù)服務,助力人工智能產(chǎn)業(yè)生態(tài)鏈進一步完善。
