亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

 首頁(yè) > 新聞 > 國(guó)內(nèi) >

語(yǔ)音識(shí)別:谷歌眼鏡們的五指山

2013-02-22 15:12:16   作者:張春暉    來(lái)源:36氪   評(píng)論:0  點(diǎn)擊:



 

  2月21日,馬克·扎克伯格在參加“生命科學(xué)突破獎(jiǎng)”基金會(huì)發(fā)布儀式上第一次嘗試了谷歌眼鏡。據(jù)在場(chǎng)記者說(shuō),他看上去對(duì)這款谷歌產(chǎn)品非常感興趣,還說(shuō)Facebook已有幾位工程師等著在為這款產(chǎn)品做開(kāi)發(fā)了。據(jù)說(shuō),他問(wèn)谷歌創(chuàng)始人謝爾蓋·布林,“怎么能戴上去不顯得尷尬?怎么能不破壞跟別人的眼光接觸而用這個(gè)眼鏡?”無(wú)從得知布林當(dāng)時(shí)做何回答。連一向?qū)⒐雀枰曌鲎畲蟾?jìng)爭(zhēng)對(duì)手的扎克伯格,都愿意為谷歌眼鏡率先做開(kāi)發(fā),這個(gè)產(chǎn)品前景太值得想象了。

  是的,太具有想像力了,扎克伯格可以用同樣的話(huà)去問(wèn)蘋(píng)果和三星:你們的手機(jī)怎么能握上去不顯得象塊石頭?他可以去問(wèn)Kindle:你們的電子閱讀器能不能卷起來(lái)塞屁股口袋里?

  無(wú)論是手機(jī)、平板、眼鏡、手表,產(chǎn)品設(shè)計(jì)的追求總是無(wú)止境的,但基于工藝的限制,在某個(gè)時(shí)代那個(gè)產(chǎn)品就只能在某一個(gè)尺寸標(biāo)準(zhǔn)下下功夫而無(wú)法突破,業(yè)內(nèi)的朋友形容這就象如來(lái)佛的五指山,只要芯片還是那么大,你想做得小都不現(xiàn)實(shí),例如蘋(píng)果手表,例如谷歌眼鏡。

  實(shí)際上,真正的如來(lái)佛的五指山,是人機(jī)互動(dòng)體驗(yàn),我無(wú)數(shù)次在想,蘋(píng)果手表真的需要那么大的屏幕嗎?它非得通過(guò)一個(gè)手指的觸控才能操控嗎?谷歌眼鏡戴起來(lái)能更能再?lài)妩c(diǎn)么?我們想想,如果說(shuō)手表還能用觸控來(lái)解決體驗(yàn),那谷歌眼鏡最好的操控體驗(yàn)是什么?搖頭晃腦?上下其手?

  對(duì)眾多電子產(chǎn)品而言,又要追求越做越小,越做越薄,又要追求更好的操控體驗(yàn),如來(lái)佛的五指山又變大了,突破口,只能等待語(yǔ)音識(shí)別!目前中國(guó)最好的語(yǔ)音識(shí)別效果最好的當(dāng)仁不讓是訊飛,連微信新增的語(yǔ)音提醒體驗(yàn)用的都是訊飛的,或者說(shuō)他們自己的語(yǔ)音團(tuán)隊(duì)揉入了訊飛的技術(shù)。全球語(yǔ)音技術(shù)做得最好的當(dāng)然就是Nuance了,從軍事到Siri,它全干了。

  很多人樂(lè)此不彼的在玩Siri,在玩訊飛語(yǔ)音輸入,并且覺(jué)得還不錯(cuò),甚至覺(jué)得非常好。實(shí)話(huà)講,是挺好的,只不過(guò)如果要說(shuō)能放到谷歌眼鏡上去,那還差十萬(wàn)八千里呢,這十萬(wàn)八千里,就是“可信識(shí)別技術(shù)”。

  一種技術(shù),無(wú)論用的是什么算法,無(wú)論是中國(guó)人還是以色列人還是美國(guó)寫(xiě)的,都無(wú)所謂,特別是對(duì)于普羅大眾而言,我們哪懂啥算法是啥?我們需要的,就是在任何自然環(huán)境下,人類(lèi)自然的講話(huà),這包括無(wú)論是在房間,還是馬路邊,還是酒吧里,在各種環(huán)境下,只要人與人之間能聽(tīng)得見(jiàn),聽(tīng)得懂,手表們眼鏡們就要聽(tīng)得懂。以及象小孩子一樣去學(xué)習(xí)。三個(gè)月前你和家里的小孩子講話(huà)你還覺(jué)得挺累的,因?yàn)樗n^不對(duì)馬嘴,詞不成詞,句不成句,三個(gè)月后你突然發(fā)現(xiàn)他詞藻豐富起來(lái),話(huà)語(yǔ)節(jié)奏以及條理一下子很清楚,開(kāi)始有邏輯性。這才是真正的“實(shí)用”與“自然體驗(yàn)”,所以,手表真的不再需要什么觸控,因?yàn)橐粋(gè)手指頭的觸控本來(lái)也談不上什么好體驗(yàn)。所以,眼鏡真的不需要搖頭晃腦或上下其手,本來(lái)鏡框也裝不下那么多的東西。

  “可信識(shí)別技術(shù)”所面對(duì)的還不僅僅是語(yǔ)音識(shí)別這一個(gè)領(lǐng)域,而是幾乎整個(gè)數(shù)字世界,就象中國(guó)傳統(tǒng)文化周易中的“八卦”,世間萬(wàn)物,一個(gè)“八卦”全部解釋清楚。Nuance、google、訊飛們能做到嗎?難,太難了,他們的技術(shù)框架同出一宗,都來(lái)自于“馬爾可夫模型理論”,這三十年以來(lái)全世界的語(yǔ)音研究幾乎都在同這個(gè)理論下做文章,可理論模型這東西就象一棟大樓的設(shè)計(jì),圖紙?jiān)O(shè)計(jì)好是30層,你蓋好之后,是不可能改成100層的,如果你想改就得重新設(shè)計(jì)圖紙重新蓋,而上述的這些公司,現(xiàn)在已經(jīng)在28層了。如果不是這幾年的“云計(jì)算”所帶來(lái)的海量語(yǔ)料,那可能還在蓋十幾層呢。

  我們現(xiàn)在需要耐心等待就是這個(gè)數(shù)字世界的“八卦”,全世界無(wú)數(shù)的科學(xué)家這三十年來(lái)為語(yǔ)音識(shí)別技術(shù)而奮斗,可能是明天,可能是十年…時(shí)間不是問(wèn)題,因?yàn)槿祟?lèi)需要一種象空氣一樣的技術(shù),你感覺(jué)不到它,而你卻每時(shí)每刻的依賴(lài)著它!

 

分享到: 收藏

專(zhuān)題