首頁>>>技術>>>語音應用>>>語音識別(ASR)  語音識別產(chǎn)品

百度發(fā)布語音搜索和手機地圖概念版兩項產(chǎn)品

2010/09/03

  9月2日消息,百度移動互聯(lián)網(wǎng)事業(yè)部徐新意今日在百度世界2010移動互聯(lián)網(wǎng)論壇上透露,百度語音搜索和手機地圖概念版兩項產(chǎn)品已經(jīng)開發(fā)完畢,并在本次大會上首次亮相。

百度移動互聯(lián)網(wǎng)事業(yè)部 徐新意

圖:百度移動互聯(lián)網(wǎng)事業(yè)部 徐新意

  徐新意稱,百度在幾個月前開始做語音搜索技術,目前隨著語音搜索后臺服務成功應用到掌上百度領域里面,標志著百度正式提供語音搜索服務!疤貏e值得一提的是,語音搜索服務在原有的基礎上,結合了移動的阿拉丁和一些客戶端的產(chǎn)品以后,產(chǎn)生了新的火花!

  徐新意稱,傳統(tǒng)的語音搜索可能說了這個環(huán)節(jié)簡單化了,一按一個按鈕就說出來,但看到結果還是歷史的,還要拿手機點,調(diào)瀏覽器去看,這其實是不完善的!敖Y合了無線阿拉丁以后,結果馬上就能看到,不需要再點了,很多信息一說完手機馬上就能看到,不需要額外的操作。”

  徐新意還談及了目前百度在手機地圖上的研發(fā),稱基于頁面、無需安裝任何應用程序的百度手機地圖已經(jīng)開發(fā)完畢,并且百度手機地圖和基于PC客戶端上具有基本一致的功能。

  “還有一款產(chǎn)品也是在這次大會上首先發(fā)布的,也是創(chuàng)新的產(chǎn)品,我們叫手機地圖概念版!彼榻B說,傳統(tǒng)的PC地圖是基于瀏覽器方式,大家可以在上面看到地圖進行信息的檢索。到了手機上,因為手機本身具有定位的功能,所以它又產(chǎn)生了很多新的需求。

  包括根據(jù)位置的查詢,包括交通流量,甚至導航的需求。這使得它比PC上更復雜。傳統(tǒng)的方式都是基于客戶端技術來做的,客戶端技術有很多障礙,比如終端適配更新的問題,甚至有尺寸的問題。

  百度則在手機上的創(chuàng)新是基于終端的發(fā)展得到了很大的提升,針對這類的終端我們推出了手機地圖的概念版,完全基于頁面基礎的,不需要安裝任何的應用程序,只要用手機訪問網(wǎng)址就能使用。

  徐新意指出,百度WAP地圖取得了很大的進展,取得了市場份額的第一位。在這個基礎上,百度在無線端也做了很多的工作,推出了WAP版的地圖,包括各種版本的WAP,適配不同的終端。手機地圖的概念版,今天也是第一次發(fā)布。

  據(jù)他介紹,百度也對不支持在線版的手機推出了手機地圖客戶端的產(chǎn)品,iPhone等平臺的地圖版本很快就可以推出來。

  以下為百度移動互聯(lián)網(wǎng)事業(yè)部徐新意演講實錄:

  徐新意:大家下午好!在這里我只選取了一些有代表性的項目給大家做個介紹。

  在百度無線的產(chǎn)品里面,無線搜索無疑是我們最核心的產(chǎn)品。過去的一段時間里,重點是從這幾個基礎的方向?qū)@個產(chǎn)品做了改進,我們的方向都是從用戶的需求產(chǎn)生的。首先,雖然搜索在3G的無線網(wǎng)絡里逐步的得到了推廣,F(xiàn)在的客戶對我們服務的響應速度和流量等這些環(huán)節(jié)是非常關心的,這也是我們的一個重要的方向。

  現(xiàn)在國內(nèi)的手機終端的產(chǎn)品非常復雜,從高端到低端,表現(xiàn)形式到都是非常復雜的,怎樣在手機上得到它們所對應的最好的體驗,這是我們在智能終端設備方面所做的一些工作。無線的搜索和PC上的搜索有一個很大的區(qū)別體現(xiàn)在,我們的手機無線網(wǎng)絡上面和搜索的交互環(huán)節(jié)是有很大障礙的。

  所謂交互是你要告訴服務商你想要什么,另一方面你要展示搜索的結果。在手機上這個環(huán)節(jié)是有很大障礙的。從客戶端的角度來看,這個環(huán)節(jié)是可以嘗試做一些解決的,比如有輸入法的產(chǎn)品。搜索引擎本身在這方面也做了很多努力。

  最基礎的搜索是從內(nèi)容來講的,基礎的問題解決了以后,就看內(nèi)容好不好。我們分析下來,發(fā)現(xiàn)在手機上除了信息類的需求,輿論類型的需求是非常多的。其中比較有典型代表性的像閱讀、游戲等等,這體現(xiàn)在垂直搜索的產(chǎn)品方面,我們也做了大量的工作。

  下面我簡單的介紹一下這幾個方向取得的一些成果。

  剛剛講到速度方面。第一,百度本身的搜索品牌效應很好,大家從各種各樣的路口使用百度的服務。這就有一個問題,手機客戶會使用各種各樣的域名,我們?nèi)绻R別他是在手機上訪問我們這些服務,就要把它引導到對應的頁面上去。這個環(huán)節(jié)有一定的時延。前段時間我們做了很多的工作,從原來4.5秒縮短到2.5秒,基本上讓人感覺到能直接進入到所需要的頁面,而并不需要一個過程。

  第二,專線改造的方面是我們的基礎建設。增加了無線網(wǎng)絡里的專線,因為很多用戶是直接從手機上網(wǎng)來訪問服務的,我們就跟運營商合作,引入了無線領域的一些專線的帶寬,同時也做了網(wǎng)絡機構上的優(yōu)化,使平均時延減少了20%,同時訪問的穩(wěn)定性也大大的提高。

  我們以前碰到過一些問題,在不同的省市,特別是手機卡也多樣性了,有很多的接入點。以前碰到過一些小的障礙,現(xiàn)在我們通過一些努力,把它大大了改善了。

  現(xiàn)在手機用戶對頁面的流量是非常關心的,在給用戶信息量不減少的情況下,怎么把流量減少到最小,這也是非常有意義的工作。一是本身流量的費用大大減小了,經(jīng)過努力,平均的結果頁面流量減少了30%,這就意味著手機的流量費就省了30%。二是頁面小了,因為網(wǎng)速很慢,PC上頁面小于30%感覺不到它對速度的提升,但在手機上的提升還是很明顯的。

  在手機訪問一個頁面,如果小了30%,基本上是可以明顯感覺到訪問的速度變快了,復雜的頁面展現(xiàn)出來的時間是有時間延遲的。這個意義不光是減小了流量,還有綜合的意義。通過這些努力,我們在速度上有了很大的改進。

  終端適配一直是無線領域的難題,現(xiàn)在我們做這塊工作主要是從三個角度來做,也是基于終端現(xiàn)狀來做的。首先國內(nèi)的現(xiàn)狀是大量的用戶還在使用比較低端的手機,俗稱山寨機。

  這些用戶本身還是有很強烈的信息需求的,因為受網(wǎng)絡帶寬跟設備的限制,又很關心效果,又很希望直接能得到想要的結果。我們要做的重點是怎么把他關心的內(nèi)容展現(xiàn)給他,同時讓他用最小的代價獲取信息。

  我們能做到的是,比如搜索一個結果,頁面里面可能只有一部分跟搜索的內(nèi)容是相關的。針對這類的終端我們會把它優(yōu)先的顯示出來,這樣就不用翻頁,直接能看到頁面里面跟搜索環(huán)節(jié)相關的部分。

  還有大量的用戶在使用一些終端的手機,這些手機不一定是能力很強的智能手機,但又需要有比較好的效果,不僅僅是需要一個結果而已。我們對這類手機也做了強化的處理,比如說現(xiàn)在看到的很多結果頁,比如說是一個用戶的博客,博客的博主是做了精心的美化工作,不僅僅只有博文。

  主題背景都是跟博主的個人性格環(huán)節(jié)相關的,如果我們僅僅是把他寫的一段話展現(xiàn)給你,你其實沒有跟網(wǎng)頁所有者全面的信息交流。如果配上背景的圖片,整個色調(diào)的配合,加上排版,你在看結果的時候,你就有一個跟PC上接近的體驗,能感覺到當時博主的心情。

  其實其他很多頁面,用戶除了對信息本身的需求,還有一些對效果上的追求。這對終端用戶來講是非常重要的,這其實也是最難的環(huán)節(jié),怎么把效能和效果做有機的平衡,我們也做了大量的工作。

  往高處做,這其實是一個新領域。以前大家對終端適配的感覺好像是我們只是把復雜的頁面轉簡單,然后給手機上的用戶用。實際上隨著iPhone等系統(tǒng)瀏覽能力的提高,包括頁面新的技術標準的產(chǎn)生,頁面轉換上也有新的要求,從手機上看到效果的同時還需要一些額外的東西,比如說好的操作。

  這些原始的頁面是不提供的,這在高端的觸屏手機上操控瀏覽體驗是很有幫助的,我們就提供了往高處轉的代碼來支持高端的終端,讓他可以在瀏覽頁面上有更好的效果。

  剛剛講到交互的問題,當然是我們通過一些客戶端的手段能感覺到的,但作為普遍的需求我們做了很多工作。比如在無線搜索上也引入了語音搜索的概念,無須裝任何客戶端,只需用瀏覽器打開搜索入口頁,就可以直接在屏幕上輸入,跟裝的輸入法沒有關系了,能夠很方便的把結果告訴他。它會比普遍的輸入法更適合用來輸入搜索內(nèi)容。

  另一方面是窄線的問題。上午李彥宏講到了很多效果,這些效果對我們來講是巨大的挑戰(zhàn),怎么讓它在手機上把阿拉丁的結果展現(xiàn)出來,我們專門成立了無線阿拉丁的小組,逐步把它遷移到移動平臺上。

  選擇哪些阿拉丁結果是最適合無線領域的。當然現(xiàn)在技術是有限的,有些技術我們引入不進來,所以我們會選擇一些用戶需求比較大,障礙比較小的東西引入進來。這樣整體搜索的展現(xiàn)效果就會得到大大的改善。

  剛剛講到娛樂化的需求,最有代表性的就是閱讀需求。在座絕大多數(shù)的人都有在手機上閱讀的習慣,閱讀軟件也是大家使用頻率比較高的,這也是我們的調(diào)查結果。有一個數(shù)據(jù),74.5%的手機網(wǎng)民都有閱讀習慣,我們需要很好的去滿足他。閱讀需求說起來很簡單,大家覺得只是看書,實際仔細想想這個事情還不是那么簡單是有一系列東西組成的。

  這方面我們做了大量的工作,在個性化首頁方面會根據(jù)你的習慣,甚至以前搜索的習慣,推薦給你可能感興趣的內(nèi)容。這樣你一進首頁就找到了這個書就是你想打發(fā)時光的書。有些書是比較知名的,你聽說這些書很好看,要想找到它,最全、最快體現(xiàn)在哪里?就是你想找到的書基本能找到,而且,最快的是可能剛出來的新書,你在這里就能找到。看了書大家會有很多感慨,需要跟別人分享一下,我們專門配備了閱讀的社區(qū),大家看完馬上就可以在這個平臺上提交感想。

  根本的是改進閱讀需求,我們做了工作,主要體現(xiàn)在閱讀的體驗改進上,比如字體的大小等等。還要特別提到,看書不可能一次看完,我們有一個書簽,這是完全基于搜索技術來做的。你搜到一本書,看到一定程度可以加書簽,不需要進行復雜的操作,下次再搜這本書可以接著看。我們也考慮到有些用戶是有離線需求的,網(wǎng)上找到東西下載下來單獨看,F(xiàn)在的小說都很長,手機的頁面很多,我們提供了打包的下載,可以把一本小說的所有章節(jié)打包下來,用你喜歡的客戶端去閱讀。

  另外一個產(chǎn)品是移動開放平臺。大會的主旨是“開放 創(chuàng)新 共贏”,在這個產(chǎn)品里得到了很好的體現(xiàn)。前幾天有一個朋友問我,他有一個PC站,現(xiàn)在很想做手機上的站點,找了一個人問需要幾萬塊錢,他問我是不是合算。我覺得很巧,這正好體現(xiàn)出一個問題,現(xiàn)在大量的中小站長,包括普通老百姓都意識到了無線的重要性,而且已經(jīng)付諸行動了。同時,他其實對這個領域是比較陌生的,對實施的手段比較陌生,不知道最好的方法是什么。我覺得百度作為大的公司,有義務在這個領域做一些工作。

  我們發(fā)現(xiàn)大量的用戶碰到一些問題,比如說90%的站長都期待有更好的移動建站的解決方案。自己做維護成本很高,在外面找個公司也不一定是專業(yè)搞得定,他也不知道手機用戶對什么內(nèi)容感興趣。針對這樣的需求,我們推出來移動開放平臺,借助了已有的一些技術,比如說終端適配、頁面?zhèn)鞔a這些技術,建立了一套完整的管理后臺,讓它變得非常的簡單化,無需了解我們的技術本身是怎么工作的;借助一個管理后臺,只要簡單的做一些維護的工作,就可以在已有的PC上生成各種各樣的手機的站點。

  我們會提供幾個主要的能力,一個是我們會給他提供各種統(tǒng)計的工具,可以了解無線網(wǎng)站上的表現(xiàn)情況,這個產(chǎn)品是完全免費的,而且適用全移動終端。這些終端設備在做搜索的時候都已經(jīng)解決了,只是把它應用到了新的領域,結合其他的技術。同時,它一是個零硬件的投入,對移動不需要額外的硬件投入,我們變相的幫他節(jié)省了服務器端的費用。我們可以幫他分析訪問用戶的接入點是什么,是用什么終端訪問的,我們給他的是站點最佳的展現(xiàn)效果。

  一個站長想使用我們的服務很簡單,首先到平臺上登記站點,進入我們的管理后臺。會有一些成型的模板,常見的模式可以套用,懂一點的還可以自己再優(yōu)化,看看預覽的效果,最后就可以了。提到掌上百度,這個產(chǎn)品已經(jīng)接入了百度很多優(yōu)質(zhì)的服務跟資源,像貼吧、知道、新聞等等。

  當然它本身核心的搜索功能也得到了很大的改善,我們也開放的支持了一些第三方的應用,包括論壇等等。掌上百度這個產(chǎn)品,未來是希望除了接入自身的服務,也可以接入其他外部優(yōu)質(zhì)的資源,讓它真正成為手機上上網(wǎng)的路口。

  下面特別要講的是語音搜索。語音搜索技術在幾個月前開始做了以后,做了很多工作。隨著語音搜索后臺服務成功應用到掌上百度領域里面,標志著我們的語音搜索服務正式提供了。

  特別值得一提的是,語音搜索服務在原有的基礎上,結合了移動的阿拉丁和一些客戶端的產(chǎn)品以后,產(chǎn)生了新的火花。比如說傳統(tǒng)的語音搜索可能說了這個環(huán)節(jié)簡單化了,一按一個按鈕就說出來了,但看到結果還是歷史的,還要拿手機點,還要調(diào)瀏覽器去看,這其實是不完善的。

  結合了無線阿拉丁以后,結果馬上就能看到,不需要再點了,很多信息一說完手機馬上就能看到,不需要額外的操作。同時我們也結合了一些技術,可以直接撥打搜索出來的電話,過程完全的簡單化了。

  我們準備了視頻的演示,請大家看一下。

  還有一款產(chǎn)品也是在這次大會上首先發(fā)布的,也是創(chuàng)新的產(chǎn)品,我們叫手機地圖概念版。大家知道,傳統(tǒng)的PC的地圖是基于瀏覽器方式的,大家可以在上面看到地圖進行信息的檢索。到了手機上,因為手機本身具有定位的功能,所以它又產(chǎn)生了很多新的需求,而且它在移動的場景下有很多新的需求,包括根據(jù)位置的查詢,包括交通流量,甚至導航的需求。這使得它比PC上更復雜。傳統(tǒng)的方式都是基于客戶端技術來做的,客戶端技術有很多障礙,比如終端適配更新的問題,甚至有尺寸的問題。

  傳統(tǒng)的導航軟件大家都有體會,很多人專門為它去買卡,因為它的信息是本地化的。我們在手機上的創(chuàng)新是基于終端的發(fā)展得到了很大的提升,針對這類的終端我們推出了手機地圖的概念版,完全基于頁面基礎的,不需要安裝任何的應用程序,只要用手機訪問網(wǎng)址就能使用。同時經(jīng)過技術優(yōu)化,它又能做到完全的流暢,和客戶端差不多的效果。因為信息是在線的,所以完全是實時的。功能也是非常豐富的,大家不要以為基于在線的服務功能是簡化的,實際上它有基于PC上客戶端基本完全一樣的功能。

  目前,WAP地圖取得了很大的進展,取得了市場份額的第一位。在這個基礎上,我們在無線端也做了很多的工作,推出了WAP版的地圖,包括各種版本的WAP,適配不同的終端。手機地圖的概念版,今天也是第一次發(fā)布。

  我們也對不支持在線版的手機推出了手機地圖客戶端的產(chǎn)品,iPhone等平臺的地圖版本很快就可以推出來。我們不僅僅提供位置服務,還提供大量的信息。PC上面的WAP地圖已經(jīng)做了很多工作,接入了各種各樣的信息進來。手機的地圖版已經(jīng)推出來了,馬上可以給大家使用。

  “快搜”產(chǎn)品我們定位為輕亮級的產(chǎn)品,可以利用客戶端的技術讓用戶得到比較好的體驗,不需要打開瀏覽器進行繁瑣的操作。已經(jīng)開始支持一些主流的終端,也支持垂直的搜索門類,可以搜索新聞、圖片,也可以搜索小說。結構客戶端做了很多優(yōu)化的工作,能讓用戶可以更便捷的使用服務。

  產(chǎn)品本身也已經(jīng)支持了語音搜索,這也是體現(xiàn)快捷的一個方面。這個產(chǎn)品具有可DIY性,跟客戶端合作會產(chǎn)生各種形態(tài)的產(chǎn)品,服務和數(shù)據(jù)都是同一套的,有各種各樣不同的形態(tài),可以根據(jù)不同終端的需求進行DIY。

  “手機輸入法”我們有很多技術在業(yè)內(nèi)都是領先的。在智能手機的終端覆蓋上具有相當?shù)膬?yōu)勢,覆蓋了最多的終端,除了最常見的Win等等,還支持了iPhone,我們克服了技術上的壁壘,提供了很好的輸入法的產(chǎn)品,包括黑莓的產(chǎn)品我們也在支持。iPhone技術支持跟進的比較好,我們首先支持了這個平臺,這個平臺的用戶大家可以去體驗一下。

  輸入法最關鍵的是核心,我們花了大量的精力在核心上改進,目前已經(jīng)完成了全新的跨平臺的輸入內(nèi)核,具有細胞詞庫,包括智能糾錯、中英混輸?shù)荣Y源,給輸入法提供強大的心臟。跟后臺的服務結合以后,后臺有新詞的解析,包括細胞詞庫的分類整理等等,根據(jù)這些信息,在后端可以提供完善的文字輸入的服務。再加上我們本身有跨平臺的輸入內(nèi)核,跟它結合以后,除了可以應用到自己產(chǎn)品的里面,很快就會應用到線上的手機產(chǎn)品輸入法,而且還可以給第三方提供穩(wěn)定的服務。

  跨平臺可以支持眾多的平臺,包括已知的智能手機平臺以及其他體系的產(chǎn)品。目前手機輸入法產(chǎn)品功能是比較完善的,支持各種各樣的輸入形態(tài),還支持最新的自定義短語,這在PC上已經(jīng)出現(xiàn)了,但手機上的應用還是第一次。因為手機上有各種輸入形態(tài),我們把它統(tǒng)一起來,有數(shù)字鍵、觸摸屏等等,利用個性短語的方式可以輸入各種各樣有意思的內(nèi)容。

  用戶在手機上聊天用到的新鮮詞、混合詞越來越多,有些不是簡單的可以用詞組來概括的,所以手機上自定義短語是非常重要的?梢远x一個詞語,也可以定義混合的詞語,比如T恤,以前手機的輸入法是輸入不了的,我們也進行了支持。也可以定義簽名檔,經(jīng)!肮嗨钡,寫完要帶一句話,定義兩個字母就可以了。當然也可以定義一個特殊的表情符號,現(xiàn)在還有一些稀奇古怪的字,可能輸入不了,但寫文章的時候經(jīng)常會用到,比如現(xiàn)在玩微博有兩個“#”字鍵的東西,傳統(tǒng)的是輸入法很難支持,通過特殊的方法稍微進行定義就可以很好的滿足。

  我們推出了智能手寫的輸入,這也是前不久剛剛上線的,在“百度世界”大會上首次推出。在傳統(tǒng)的手寫輸入相比有兩大改進,一是除了自己的手寫功能之外,有一個強大的觸摸屏的軟鍵盤的收入跟他配合。有些人手寫覺得寫中文是很方便的,但碰到輸入標點符號等就頭大了。傳統(tǒng)的手寫輸入法在這個領域是比較薄弱的,我們本身具有很強的軟鍵盤的輸入能力,我們提供了鍵盤寫的功能,既可以寫字,又可以通過軟鍵盤去輸入,完全不需要切換,直接在一個界面就可以完成。

  另外一個改進的方面我們是可以把新詞和舊詞結合起來。以前手寫的詞語是固定的,現(xiàn)在產(chǎn)品的詞語都已經(jīng)是網(wǎng)絡詞庫了,最新的詞語通過聯(lián)想的方式,你寫一個“百”會聯(lián)想到“度”。最新的詞都可以很快的聯(lián)想出來,縮短了手寫的頻次。

  后面的幾個月大家就可以看到這方面的成果。PC上已經(jīng)推出了這種輸入法,手機的輸入法未來很快就會跟它對接,用戶的習慣、詞庫等等都可以同步進來。我們現(xiàn)在已經(jīng)有很強的語音輸入的后臺,跟手機客戶端輸入法的產(chǎn)品相結合,他既能享受云端的服務,又可以用在各種地方,不像以前的語音輸入只有在進入搜索的頁面時才能用到。這樣一下子克服了以前手機輸入法跟PC相比不足的地方,完全可以取得與PC上一樣的整句輸入的效果。

  基于語音搜索技術的基礎上我們做了進一步的優(yōu)化,有了優(yōu)化的語音識別,把它擴展到無限級。其實也不是無限,就是常用的十幾萬個詞,這樣就可以基本實現(xiàn)語音輸入常見的短語通過一句話就可以識別出來。

  以上介紹的是具有代表性的產(chǎn)品,其實我們還有更多的產(chǎn)品會陸續(xù)的發(fā)布出來。這些產(chǎn)品都是非常值得期待的,可以很好的滿足大家各方面需求,所以敬請大家關注。以上做的各種工作,其實目的非常簡單,就是利用在產(chǎn)品和技術上的創(chuàng)新,努力的來改善大家在移動領域的生活的各個方面。
共 2 頁:1 2 

騰訊科技



相關閱讀:
聯(lián)通重啟即時通訊工具開發(fā) 將可跨網(wǎng)發(fā)短信 2010-09-03
移動支付標準加速制定 運營商與銀行貼身合作 2010-09-03
騰訊一月兩次上中移動違規(guī)SP黑榜 2010-09-02
四川移動將“二次確認”系統(tǒng)升級 SP接到通知 2010-09-01
諾基亞Ovi商店正式商用 與開發(fā)者三七分成 2010-09-01

熱點專題:  語音合成TTS 語音識別ASR    移動增值
分類信息:  移動增值_與_語音應用  移動增值_與_互聯(lián)網(wǎng)  移動增值_與_互聯(lián)網(wǎng)
相關頻道:  增值電信新聞