電腦科技日新月異,在不久的將來,電腦和人的聲音將難分真假,人們用家庭個(gè)人電腦,便可制造河面因突然下雨而產(chǎn)生無數(shù)漣漪的畫面效果,仿真而且互動(dòng),世界真正進(jìn)入新一代多媒體的時(shí)代。
這一天可能不遠(yuǎn)了,因?yàn)槲④浌久磕暾趽艹鼍揞~預(yù)算,進(jìn)行基本電腦科技研發(fā),成果日益豐盈。
微軟公司目前已面市的office XP軟件和視窗XP操作系統(tǒng)所采用的,由微軟亞洲研究院開發(fā)的語(yǔ)音合成技術(shù),已經(jīng)能夠讓電腦講比較自然的中文和英語(yǔ)。
微軟亞洲研究院院長(zhǎng)張亞勤博士昨日與新加坡媒體分享該研究院的科研成果時(shí)透露,研究院曾經(jīng)“讓微軟主席比爾·蓋茨在中國(guó)學(xué)生面前講流利標(biāo)準(zhǔn)的中文”。
這當(dāng)然不是真的,因?yàn)楸葼枴どw茨并不會(huì)講中文,這是語(yǔ)音合成技術(shù)創(chuàng)造的。
未來需要“聲音密碼”
目前來說,人們也還是能夠聽出那是電腦在說話,不是真人在講話。不過,張亞勤博士表示:“在三五年后,經(jīng)過許多的研究努力,我們將無法分辨究竟是人類或者是電腦在說話。事實(shí)上,電腦所講的中文或英語(yǔ),將比一般人都標(biāo)準(zhǔn)!
因此,他指出,到時(shí)人們可能就需要聲音密碼(speech ID),“以防自己的聲音被別人使用”。
語(yǔ)音合成技術(shù)還能夠讓電腦模擬不同人的聲音,女人的聲音、男人的聲音,小孩的聲音,而且可以輕易的調(diào)整音調(diào)。在這個(gè)基礎(chǔ)上,研究院開發(fā)了讓人們能輕易的用個(gè)人電腦制作“語(yǔ)音合成童話”的軟件。這個(gè)軟件將來可能與微軟的一些產(chǎn)品一齊推出。
張亞勤博士還展示了新一代多媒體的情況,你可以隨心所欲的調(diào)整觀看畫面景色的角度、遠(yuǎn)近,享受互動(dòng)式畫面效果,例如水面漣漪、下雨、晝夜不同之景觀,甚至是追趕河上盤旋的飛禽。還可以試看畫面在白天和夜晚的不同效果。
當(dāng)然,微軟亞洲研究院的研究成果不只這些,張博士還演示了微軟開發(fā)的技術(shù),如何改善音樂和影片通過無線網(wǎng)絡(luò)播放的效果,以及電腦模擬真人跳舞,甚至讓電腦模特兒“隨樂而動(dòng)”的能耐。不只是人,電腦可以模擬甚至是改造任何動(dòng)物的動(dòng)作、聲音,把鹿化為馬、把貓變成兔。