談?wù)Z音識別技術(shù)的產(chǎn)業(yè)化
王作英
2002/10/14
語音識別,是一項(xiàng)已經(jīng)被科學(xué)界關(guān)注了幾十年的技術(shù)。雖然現(xiàn)在已經(jīng)沒有人否認(rèn)語音識別技術(shù)廣闊的應(yīng)用前景和深遠(yuǎn)的社會意義,工業(yè)界也一再對其前景表示看好,但是語音識別能不能就此成功邁出產(chǎn)業(yè)化的步伐,能不能真正走入人們的日常生活得到普遍的應(yīng)用,這仍然是一個疑問。
本人認(rèn)為,一項(xiàng)技術(shù)能不能得到普及,能不能被市場所接受,最關(guān)鍵的有三點(diǎn):一是這項(xiàng)技術(shù)能不能給人們帶來價(jià)值,即它是否能給人們帶來便利,解決困難,提高效率;或者是改善生活,增加樂趣。從這一點(diǎn)來說,語音識別技術(shù)的價(jià)值是驚人的。語音作為人們最自然的交流方式,是最理想的下一代人機(jī)界面。它的使用,將是人類的生活方式的一次革命。
第二是技術(shù)的實(shí)用性和成熟性。不必諱言,現(xiàn)在的語音識別技術(shù)確實(shí)并不完美,還有很多問題亟待解決,例如對環(huán)境的適應(yīng)性和對語言的理解等。不過,在很多實(shí)際應(yīng)用中,目前的語音識別技術(shù)已經(jīng)足以發(fā)揮作用。例如專用領(lǐng)域的語音輸入、無線互聯(lián)移動終端的語音控制和語音查詢、各種軟件的語音控制、呼叫中心的自動語音應(yīng)答等。我們必須認(rèn)識到,沒有一項(xiàng)技術(shù)在被投入市場時就已經(jīng)是完善的了,市場的培育、應(yīng)用的需求、用戶的反饋是技術(shù)廣泛普及的必經(jīng)之路。因此,尋找語音識別技術(shù)與實(shí)際需求最佳的結(jié)合點(diǎn),找到最合適的語音識別應(yīng)用,是語音識別技術(shù)產(chǎn)業(yè)化的關(guān)鍵。
第三是產(chǎn)品的性價(jià)比。那些價(jià)格很高但作用很小的產(chǎn)品是不會受到用戶青睞的。由于IT產(chǎn)業(yè)的高速發(fā)展,硬件設(shè)備的成本不斷降低,而提供的資源卻不斷提高。摩爾定律依然在發(fā)揮著作用,并且這種趨勢還會繼續(xù)保持下去,這就為語音識別技術(shù)的實(shí)現(xiàn)提供了很好的平臺和條件。這也使語音識別產(chǎn)品能夠擁有較好的產(chǎn)品性價(jià)比。
語音技術(shù)對于用戶,將會成為人機(jī)交互的界面;對于產(chǎn)業(yè),將會成為標(biāo)準(zhǔn)平臺;對于運(yùn)營,將會成為增值服務(wù)。當(dāng)然,這種多贏局面的形成,有賴于技術(shù)提供商、設(shè)備制造商和服務(wù)運(yùn)營商的共同努力。我們相信,語音時代的序幕已經(jīng)拉開,語音技術(shù)產(chǎn)業(yè)化將勢不可擋。
賽迪網(wǎng) 中國信息化(industry.ccidnet.com)