常有人戲稱廣東人是羊,因?yàn)樗麄儫o(wú)論講什么,似乎都會(huì)用"咩--咩--咩--"作句尾語(yǔ)氣詞:
"有咩搞作?"(有什么做法、計(jì)劃?)
"系度做緊咩呀"(現(xiàn)在在做什么呢?)
"系咩?"(是嗎?)
這些地道的粵語(yǔ)仿佛自帶音效,你即使不精通粵語(yǔ),看到這幾句話都能像模像樣地說(shuō)出來(lái);浾Z(yǔ)就像一種流傳千年的文化符號(hào),一旦你深入了解粵語(yǔ),必會(huì)佩服它的古樸有趣、博大精深,承載了廣府文化強(qiáng)烈的情感認(rèn)同。
粵語(yǔ),又稱廣東話,是中國(guó)漢語(yǔ)七大方言之一,全球?qū)⒔?.2億人口使用,在國(guó)際影響力和語(yǔ)言的韻味方面,粵語(yǔ)的地位絕對(duì)是重量級(jí)的老大。
隨著AI的飛速發(fā)展,應(yīng)用場(chǎng)景不斷擴(kuò)展,智能語(yǔ)音設(shè)備無(wú)處不在,對(duì)于多語(yǔ)種多口音語(yǔ)音識(shí)別的需求也在日漸增加。其中,作為擁有強(qiáng)大號(hào)召力的粵語(yǔ),已成為眾多人工智能廠商關(guān)注的重點(diǎn)。
雖然粵語(yǔ)語(yǔ)音識(shí)別需求越來(lái)越多,但想要實(shí)現(xiàn)精準(zhǔn)的粵語(yǔ)識(shí)別效果,面臨的技術(shù)難度也不小。
粵語(yǔ)有多難?
由于承接著古漢語(yǔ)的許多特點(diǎn),粵語(yǔ)在詞匯、語(yǔ)法、發(fā)音上都和普通話有明顯區(qū)別。
詞匯上,粵語(yǔ)的日常用語(yǔ)富有特色。雖是口語(yǔ),卻比較"文縐縐":"喜歡"叫做"鐘意","厲害"叫做"犀利","討厭"是"乞人憎",勞駕他人、感謝幫忙,要說(shuō)"唔該";浾Z(yǔ)的發(fā)音就更難了。由于保留了古漢語(yǔ)、古南越語(yǔ)的特色,以及受外語(yǔ)的影響,相對(duì)于普通話的四聲調(diào),粵語(yǔ)擁有完整的九韻六調(diào),能夠組合出的總音節(jié)數(shù)比普通話還要多。
標(biāo)貝科技粵語(yǔ)語(yǔ)音識(shí)別
對(duì)于AI語(yǔ)音產(chǎn)品來(lái)說(shuō),想要提高語(yǔ)音識(shí)別的準(zhǔn)確性,就需要大量的優(yōu)質(zhì)語(yǔ)音數(shù)據(jù)作為模型訓(xùn)練支撐。面對(duì)以上問(wèn)題及粵語(yǔ)語(yǔ)音識(shí)別發(fā)展現(xiàn)狀,標(biāo)貝科技此前已經(jīng)推出一系列粵語(yǔ)語(yǔ)音識(shí)別數(shù)據(jù)集,幫助對(duì)識(shí)別模型進(jìn)行優(yōu)化訓(xùn)練。
近日,標(biāo)貝科技在融合更多語(yǔ)音和文本的數(shù)據(jù)采集,以及高精度的數(shù)據(jù)標(biāo)注基礎(chǔ)上,定制專用語(yǔ)音識(shí)別模型,推出高準(zhǔn)確率的粵語(yǔ)語(yǔ)音識(shí)別服務(wù)。
在聲學(xué)模型方面,通過(guò)采集大量真實(shí)的粵語(yǔ)錄音數(shù)據(jù),包括朗讀式、自由交談和命令詞等類型,對(duì)粵語(yǔ)的發(fā)音習(xí)慣、聲調(diào)變化等,進(jìn)行學(xué)習(xí)訓(xùn)練,提高模型精度和識(shí)別率。
語(yǔ)言模型方面,標(biāo)貝科技語(yǔ)音識(shí)別技術(shù)通過(guò)對(duì)粵語(yǔ)方言中的特有詞匯,如"咁"、"哋"、"嘅"、"咩呀"、"點(diǎn)睇"等進(jìn)行專門(mén)訓(xùn)練,有效提升了語(yǔ)音識(shí)別引擎對(duì)口音、詞匯的適配能力。
立足應(yīng)用場(chǎng)景 助力人機(jī)交互更便捷
在移動(dòng)互聯(lián)網(wǎng)和信息大爆炸時(shí)代,無(wú)論是從語(yǔ)言角度還是文化角度,我們都不再離群索居,包括人與人的交流、人與機(jī)器的交流,多語(yǔ)種和方言的交匯互通已經(jīng)無(wú)處不在。因而,智能語(yǔ)音識(shí)別技術(shù)成為解決"聽(tīng)不懂"的有效途徑。
伴隨此次粵語(yǔ)語(yǔ)音識(shí)別能力的上線,當(dāng)前標(biāo)貝科技可以支持中文、英文、粵語(yǔ)三種語(yǔ)言的語(yǔ)音識(shí)別,可以廣泛應(yīng)用于工作、生活、學(xué)習(xí)多種場(chǎng)景。
在商務(wù)會(huì)談中,無(wú)論發(fā)言人說(shuō)的是英文、普通話還是粵語(yǔ),標(biāo)貝科技語(yǔ)音識(shí)別都能對(duì)這些發(fā)言分角色進(jìn)行識(shí)別,將會(huì)議和訪談的音頻快速生成會(huì)議記錄,后期信息檢索和整理更方便快捷。
在智能客服領(lǐng)域,客服機(jī)器人掌握多個(gè)語(yǔ)種,能提高普通話、英文、方言識(shí)別的準(zhǔn)確率,從而精準(zhǔn)識(shí)別出用戶提出的問(wèn)題,給予用戶最合適的回答,成為真正"聽(tīng)得懂,說(shuō)得出"的智能客服,提升服務(wù)質(zhì)量。
智能家居場(chǎng)景下,精準(zhǔn)高效的語(yǔ)音識(shí)別讓用戶不必再擔(dān)心因?yàn)榭谝魡?wèn)題出現(xiàn)的錯(cuò)輸、漏輸問(wèn)題,隨心所欲對(duì)各類家居、家電語(yǔ)音助手,以及智能機(jī)器人、智能可穿戴設(shè)備等進(jìn)行語(yǔ)音控制。
同時(shí),面向金融、電商、教育、媒體娛樂(lè)等行業(yè),我們也推出行業(yè)領(lǐng)先的語(yǔ)音合成方案,擁有豐富的語(yǔ)音合成音庫(kù),覆蓋中文、英文、中英混讀、小語(yǔ)種、方言等不同語(yǔ)種?蛻艨煽焖龠x擇合適的音色,也可以根據(jù)業(yè)務(wù)場(chǎng)景需求,定制與產(chǎn)品形象相匹配的合成聲音,助力語(yǔ)音產(chǎn)品快速落地應(yīng)用。
未來(lái),隨著語(yǔ)音交互技術(shù)與智能手機(jī)、平板電腦、智能家居等電子設(shè)備芯片集成的深入發(fā)展,將帶動(dòng)智能語(yǔ)音產(chǎn)業(yè)迎來(lái)更加廣闊的發(fā)展空間。標(biāo)貝科技將繼續(xù)加碼研發(fā)投入,加速在垂直行業(yè)進(jìn)行滲透和布局,驅(qū)動(dòng)語(yǔ)音合成、語(yǔ)音識(shí)別技術(shù)繼續(xù)升級(jí)迭代,為消費(fèi)者創(chuàng)造更優(yōu)質(zhì)的交互體驗(yàn)。