首頁(yè)>>>行業(yè)應(yīng)用>>>移動(dòng)     [相關(guān)廠商信息]

Myspace首席技術(shù)官譚曉生:移動(dòng)社區(qū)搜索

2008/12/19

  12月18日-19日,第二屆CNGI工程技術(shù)論壇暨移動(dòng)互聯(lián)網(wǎng)國(guó)際峰會(huì)在北京召開,會(huì)上,工信部副部長(zhǎng)奚國(guó)華、中國(guó)移動(dòng)副總裁沙躍家、中國(guó)工程院副院長(zhǎng)鄔賀銓、以及各大設(shè)備廠商、終端制造商、內(nèi)容服務(wù)提供商等出席了會(huì)議并做了主題演講。

  以下是Myspace首席技術(shù)官譚曉生的演講實(shí)錄。

  譚曉生:謝謝主持人,剛才前面幾位嘉賓很多都談到了facebook和Myspace,今年三月份我們給這個(gè)網(wǎng)站起了一個(gè)中文名字叫做聚友網(wǎng),Myspace對(duì)中國(guó)很多用戶聽起來(lái)都會(huì)有很多的困難的。Myspace是從互聯(lián)網(wǎng)起家的SNS網(wǎng)站。因?yàn)樗蟹浅}嫶蟮幕ヂ?lián)網(wǎng)的基礎(chǔ),所以開始比較早的進(jìn)入到手機(jī)的應(yīng)用,從Web的應(yīng)用到嵌入式客戶端的應(yīng)用都有,目前在Myspace.com有各種各樣的傳統(tǒng)的操作系統(tǒng)方面的應(yīng)用,也有比較新的像iphone上面的,像Google的系統(tǒng)下面都有客戶端的SNS的應(yīng)用,但是應(yīng)用的模式基本上還是從互聯(lián)網(wǎng)到手機(jī)的擴(kuò)展,沒有太多的做完全基于手機(jī)的SNS,更多的把互聯(lián)網(wǎng)上SNS的功能移植到手機(jī)的客戶端上,方便用戶的使用,目前還是處于這樣的階段。

  對(duì)于Myspace中國(guó)來(lái)說(shuō),聚友網(wǎng)我們?cè)?8年推出了第一個(gè)免費(fèi)版本,也是考慮到中國(guó)手機(jī)的用戶和互聯(lián)網(wǎng)的用戶,其實(shí)用戶使用體驗(yàn)和西方的用戶差別都比較大。今天談到的題目是移動(dòng)社區(qū)搜索,在07年5月份我們就組建了一支團(tuán)隊(duì),是來(lái)做個(gè)性化的信息搜索,這里面正好在移動(dòng)社區(qū)收縮當(dāng)中可以使用到這樣一個(gè)技術(shù)。首先這是一個(gè)背景數(shù)字,我就不過(guò)多的做介紹了,中國(guó)互聯(lián)網(wǎng)的用戶市場(chǎng)仍然是保持非常快速的增長(zhǎng)的。社區(qū)交友的用戶量也非常大,而且尤其在東亞區(qū),對(duì)SNS的使用比例也是比較高的。

  用戶為什么在社區(qū)里面要使用搜索?這種使用其實(shí)還是有點(diǎn)不太一樣,在社交網(wǎng)絡(luò)里面,他如果要來(lái)搜索,第一個(gè)會(huì)在已經(jīng)存在的人際關(guān)心網(wǎng)絡(luò)里面找到其中某一個(gè)人,或者某一個(gè)人的信息,在SNS里面分,分network和networking兩種不同的分支,第一個(gè)network是把已經(jīng)有的社交網(wǎng)絡(luò)搬到移動(dòng)互聯(lián)網(wǎng)或者客戶端進(jìn)行訪問(wèn),這種要找已經(jīng)有的這些朋友,找到已經(jīng)有的聯(lián)系人,然后找到已經(jīng)有的聯(lián)系人,基本上一個(gè)要看他最近有什么樣新的動(dòng)向,比如說(shuō)他web狀態(tài)信息是什么,或者他現(xiàn)在和誰(shuí)又成為了朋友,他新發(fā)了一張照片或者新寫了一篇博客等等,這是對(duì)已有朋友的了解,找到這個(gè)人以及這個(gè)人相關(guān)的信息。還有一種需求是在陌生的環(huán)境里,他要交新的朋友,像networking這種應(yīng)用,就是要找一個(gè)人去聊一聊,要結(jié)識(shí)新的朋友,一般的目的一個(gè)是為了打發(fā)時(shí)間,另外就是為了找一些艷遇這也是非常正常的。在陌生人的網(wǎng)絡(luò)里面,陌生人的量是非常大的,在Myspace有3億多注冊(cè)用戶,在聚友網(wǎng)內(nèi)也有差不多將近600萬(wàn)的用戶,在這里面你找到什么樣的人是你所需要的,如果一個(gè)個(gè)看和聊成本是非常高的。另外他不是為了找人,他上來(lái)是為了找有趣的內(nèi)容,比如很多上聚友網(wǎng)的內(nèi)容很多的是為了看博客和照片,尤其是看照片是第一需求,找各種各樣的照片看,看到誰(shuí)比較來(lái)電,就會(huì)去看看這個(gè)人寫的博客,或者去他的空間看一看,這是一種比較典型的應(yīng)用。我們?nèi)绻谑謾C(jī)終端上做這樣的服務(wù)就相當(dāng)?shù)睦щy,比互聯(lián)網(wǎng)還要難。手機(jī)終端的展現(xiàn)能力比較有限,你看照片的話不可能看尺寸太大的照片,如果看空間的話,往往都是抽象出來(lái),比如說(shuō)這個(gè)名字是什么,昵稱是什么,多大年齡,是男的還是女的,這些信息的展現(xiàn)非常有限,和互聯(lián)網(wǎng)的應(yīng)用有很大的差別。在這種情況下,用戶的互動(dòng)也不會(huì)像電腦上一樣,找的如果不太合適很方便的翻頁(yè),可以瀏覽的比較快,通過(guò)手機(jī)終端去做的時(shí)候,交互的速度相對(duì)比較慢,通過(guò)大量得按鍵操作,這個(gè)時(shí)間也相對(duì)來(lái)講比較長(zhǎng),這里面就有如何我們給用戶提供,僅僅是給自己有用的信息。其實(shí)我們有一個(gè)理念,什么東西是信息呢?信息是用戶能夠信任的,并且和用戶息息相關(guān)的這些消息才稱之為信息,對(duì)于用戶是有用的這些信息。

  怎么解決這些問(wèn)題?我們從去年5月份實(shí)踐就是要做個(gè)性化的信息提取,第一包括了用戶個(gè)人的信息空間,和他自己要檢索的信息空間,和我們這個(gè)社區(qū)里面已經(jīng)有的信息空間,在里面要做一些匹配,目前我們做了一些嘗試,首先看我們有什么樣的東西,就是在這種社交網(wǎng)絡(luò)里面有用戶的姓名,有他所在的國(guó)家或者地區(qū),有他所在的地域信息,其實(shí)這里面地域信息一個(gè)是通過(guò)IP地址自動(dòng)提取的歸屬地在哪里,另外就是有年齡和性別,在Myspace我們還會(huì)要求用戶填他的性取向,其實(shí)在中國(guó)目前比較開放的國(guó)家,他填的還是蠻開放的,同性戀什么的也都會(huì)填上去,而且基本上也不會(huì)隱諱這些東西。用戶會(huì)來(lái)填寫自己的興趣和個(gè)性,是喜歡聽音樂(lè),喜歡古典還是什么音樂(lè),有些什么愛好,都是自己填出來(lái)。還有他會(huì)填自己受教育和工作的經(jīng)歷,在Myspace這種陌生人的交友網(wǎng)絡(luò)上填的相對(duì)小一些。比如像facebook,像國(guó)內(nèi)的校內(nèi)網(wǎng)用戶的信息就會(huì)填得很好,你幫他檢索所需要的人或者是內(nèi)容的時(shí)候,都會(huì)非常有用。他感興趣的群體這個(gè)是在Myspace填的很多的,就是你上來(lái)為了干什么,你為了結(jié)交什么樣的人?這是用戶自己所聲明的信息,這是我們作為用戶興趣顯性挖掘的時(shí)候,我們當(dāng)做顯性信息。

  還有其他隱性的東西就是這個(gè)用戶在上面交了什么樣的朋友,他的朋友都有什么樣的特性,我們通過(guò)這個(gè)都是能夠知道的。還有這些用戶自己都產(chǎn)生了什么樣的內(nèi)容,他說(shuō)他自己上來(lái)是為了找音樂(lè)愛好者的,但是如果他整天看的都是美女圖,看的這些博客的內(nèi)容也都是在某一個(gè)另外的傾向上,我們可以認(rèn)為用戶自己聲稱的東西和實(shí)際的表現(xiàn)是有差別的,這是用戶的行為。這些用戶自己產(chǎn)生和消費(fèi)的內(nèi)容,比如他讀了什么東西,寫了什么東西,他都看過(guò)什么樣的空間,他和朋友互動(dòng)的時(shí)候,這里面用戶在社區(qū)里面經(jīng)常會(huì)碰到美女,認(rèn)識(shí)一下,交換一下QQ號(hào),還有就是直接的問(wèn),你有沒有興趣我們晚上一起出去什么的,這種都會(huì)有,也是反映用戶的行為特性的,我們雖然說(shuō)從隱私保護(hù)來(lái)講別的用戶不會(huì)知道這些信息,但是我們做后臺(tái)分析的時(shí)候這是能夠知道的,有多少人的興趣是一夜情,這個(gè)我們也是可以知道的。比如對(duì)廣告點(diǎn)擊的歷史也可能知道,他感興趣的內(nèi)容是什么,比如說(shuō)現(xiàn)在投了三星的廣告,這個(gè)用戶是不是點(diǎn)擊了這個(gè),點(diǎn)擊了這個(gè),這個(gè)階段他對(duì)手機(jī)感興趣是相對(duì)比較大的。他安裝了一些什么樣的SNS,現(xiàn)在Myspace也是做了開放平臺(tái),今年4月份的時(shí)候我們做的,在這西面用戶安裝了什么樣類型的也是一個(gè)隱含的信息,他喜歡展示類的還是喜歡和人去互動(dòng)類的,還是安裝的是一個(gè)比較偏暴力的游戲,這些信息部分我們叫做隱性的挖掘,就是用戶隱性信息的挖掘,根據(jù)他的行為,不是他自己聲明的,是自己實(shí)際做的。

  這個(gè)項(xiàng)目是在去年5月份立項(xiàng)的,今年年初我們開始和國(guó)內(nèi)一家機(jī)構(gòu)進(jìn)行合作,這個(gè)方面也非常有意思,個(gè)性化信息檢索是我們國(guó)家自然科學(xué)基金一個(gè)項(xiàng)目,研究機(jī)構(gòu)有一個(gè)痛苦的地方,他們沒有用戶海量的數(shù)據(jù)和用戶行為的數(shù)據(jù),Myspace正好有這樣一個(gè)特點(diǎn),我們和國(guó)內(nèi)一家科研機(jī)構(gòu)達(dá)成一個(gè)合作,由他們幫我們做一些基礎(chǔ)的科研,我們提取一部分用戶數(shù)據(jù)來(lái)作為科研輸入的東西,以及作為驗(yàn)證的一些資料,同時(shí)我們自己有一個(gè)三四個(gè)人的團(tuán)隊(duì),由他們來(lái)做商業(yè)化,就是怎么樣轉(zhuǎn)化到實(shí)際中的應(yīng)用,到后面大家會(huì)看到我們有一個(gè)系統(tǒng),是一個(gè)內(nèi)部使用的,在我們產(chǎn)品上實(shí)際上已經(jīng)投放了,在內(nèi)部要評(píng)估,叫做information for you。在這里面可以看到,這是inforU的截平,每個(gè)ID對(duì)照的是一個(gè)用戶,這個(gè)ID對(duì)照的用戶來(lái)說(shuō),我們這里面提取出來(lái)的可能會(huì)有的興趣,這個(gè)提取是顯示和隱性兩部分都有的,他自己聲明的是什么,他寫的博客是什么,目前還沒有加入到用戶人和人之間的互動(dòng),而是自己產(chǎn)生的內(nèi)容,他在博客里面寫的,和在論壇里面發(fā)的東西,我們提取他對(duì)什么感興趣,這個(gè)里面有閱讀、輪滑,喜歡電視,又練瑜珈,又看了《狼圖騰》這個(gè)書,這些東西其實(shí)在做用戶匹配的時(shí)候,給他推薦朋友的時(shí)候,我們現(xiàn)在在傳播的模塊里面有一個(gè)這個(gè)人你可能會(huì)認(rèn)識(shí),或者這個(gè)人你會(huì)感興趣,給他推薦的時(shí)候會(huì)加上這樣的匹配。這里面有一個(gè)我們是同行,或者我們過(guò)去是同事,或者是同學(xué),這個(gè)比較多的是從顯性化里面的,他如果填了社交網(wǎng)絡(luò)可以填業(yè)緣。地緣我們是同一個(gè)城市的,或者我通過(guò)IP地址可以看到你是非常近的區(qū)域的,我和你所處的地理位置比較近,比如像一些群組里面,比較明顯的要做一些線下活動(dòng),給他推薦的地域至少是同一個(gè)城市,可能產(chǎn)生一些事情,這是地緣。音緣,Myspace在整個(gè)全球里面有980萬(wàn)的音樂(lè)人,在中國(guó)雖然中國(guó)的本土音樂(lè)很少,但是畢竟音樂(lè)是Myspace的一個(gè)招牌,很多人上來(lái)也是為了聽歐美的音樂(lè)或者和音樂(lè)人有一些交往,音緣就是你們都是喜歡某種類型的音樂(lè),我們會(huì)記錄用戶所有的音樂(lè)消費(fèi)歷史,在空間的玩法里面,用戶為了找某一個(gè)音樂(lè)放在自己的空間里面當(dāng)做空間的背景音樂(lè),大多數(shù)用戶都有這樣的選擇。他歷史上都選擇過(guò)什么樣的音樂(lè),我們都是給他記錄下來(lái)的,叫做歌單,從這個(gè)歌曲來(lái)說(shuō),其實(shí)最后可以分出來(lái),這個(gè)音樂(lè)是屬于什么類型的音樂(lè)。在音緣里面,給他推薦個(gè)性化信息的時(shí)候,這首歌你可能會(huì)喜歡,或者這個(gè)人他的音樂(lè)方面的愛好和你非常像,你愿不愿意看看是不是可以成為朋友。

  這是我們實(shí)際在產(chǎn)品里面的體現(xiàn),就是你可能認(rèn)識(shí)他們,但是這個(gè)產(chǎn)品的體驗(yàn)做得還不是很好,我們馬上要推出的版本里面會(huì)直接告訴你為什么我推薦他。這是我們的一個(gè)問(wèn)題,給他推薦了,但是沒告訴他為什么你可能會(huì)和這個(gè)人有緣,這里面的信息有,只是沒有把這個(gè)展現(xiàn)出來(lái),在下一個(gè)版本里面這些東西就都會(huì)有的。

  這是Myspace日本的手機(jī)客戶端,Myspace在全球里面,在手機(jī)上做得最好的是Myspace日本,美國(guó)目前Myspace.com所做的產(chǎn)品,基本上就是把Web上的功能引到手機(jī)上,就是所有的功能都可以有,但是用戶的使用體驗(yàn)的確用起來(lái)不是很方便。包括Myspace中國(guó)我們是把Iphone也開發(fā)出來(lái)了,應(yīng)該這幾天就可以發(fā)布。這個(gè)版也是繼承了美國(guó)的風(fēng)格,就是僅僅是完成了所有的功能,功能很全,我們估計(jì)中國(guó)用戶用的時(shí)候不是很方便。像剛才說(shuō)的我們的推薦,這部分內(nèi)容也沒有帶進(jìn)去,第一個(gè)版本也沒有帶進(jìn)去,但是下面會(huì)集成進(jìn)去,第一個(gè)我們當(dāng)做練手的Iphone,下面會(huì)往手機(jī)平臺(tái)上做。這是Myspace最新的一些消息,這是網(wǎng)站推薦的內(nèi)容,這是網(wǎng)站推薦的人,還有這些朋友請(qǐng)求,這個(gè)版本比較多的就是功能性的,在這里面可以看到有音樂(lè)內(nèi)容,可以給你推薦音樂(lè)內(nèi)容,允許用戶對(duì)別人進(jìn)行評(píng)價(jià),這邊是做廣告的,這里面在Myspace Japan里面會(huì)有TV,在中國(guó)TV是進(jìn)不來(lái)的。這是要找某一個(gè)音樂(lè)人的界面,這是對(duì)于用戶的空間來(lái)進(jìn)行評(píng)級(jí),對(duì)音樂(lè)來(lái)進(jìn)行評(píng)級(jí),對(duì)于視頻進(jìn)行評(píng)級(jí),這部分的東西一個(gè)是和搜索相關(guān),另外就是和方式相關(guān)。在這里面有非常大的改進(jìn)空間,可以做個(gè)性化的,根據(jù)用戶過(guò)去消費(fèi)的歷史進(jìn)行匹配。

  回過(guò)頭來(lái)做一個(gè)總結(jié),個(gè)性化信息檢索目前處于一個(gè)什么階段?個(gè)性化信息檢索,研究的開始其實(shí)在上個(gè)世紀(jì)的80年代就開始的,包括斯坦福、卡內(nèi)基梅隴、微軟的美國(guó)研究院,以及國(guó)內(nèi)的北大研究室,復(fù)旦大學(xué)、中科院計(jì)算所、哈爾濱工業(yè)大學(xué)等等這些研究機(jī)構(gòu)或者是學(xué)校,其實(shí)早就開始在做個(gè)性化信息的檢索。但是真正的個(gè)性化信息檢索開始引起足夠的重視,比如說(shuō)進(jìn)入到國(guó)家自然科學(xué)基金應(yīng)該是去年到今年的事情,而研究機(jī)構(gòu)在這方面其實(shí)是面臨著很大的困難,經(jīng)費(fèi)還是小事,最主要的沒有數(shù)據(jù),而這方面的研究,其實(shí)大量的要靠樣本,原有的數(shù)據(jù)拿過(guò)來(lái)做模型,看這個(gè)模型訓(xùn)練的結(jié)果,最后再看評(píng)估體系,往往還是加上是人介入的。就是一般的比如編輯拿過(guò)來(lái),用人工來(lái)判定,人工來(lái)判定當(dāng)做一個(gè)學(xué)習(xí)的資料去學(xué),再由人工判定的資料做一個(gè)自動(dòng)的判定,最后往往還有大量人工的判定,檢測(cè)模型的效果,不行的話再進(jìn)行調(diào)整,這是用的主流的方法之一。在這里面包括了要建用戶檢索的信息空間模型,在做這種個(gè)性化信息檢索里面,還會(huì)挖掘人和人之間的關(guān)系,挖掘人的社會(huì)屬性,他的朋友是什么樣子的,他的朋友的信息也會(huì)當(dāng)做他檢索模型里面的信息要推送過(guò)來(lái)。同時(shí)最后還會(huì)做一些協(xié)同過(guò)濾方面的東西,就是和他相似的這些人檢索信息的時(shí)候有什么樣的特色,最終也會(huì)當(dāng)做他所檢索信息的一些屬性進(jìn)來(lái)。就是他的朋友以及系統(tǒng)給他自動(dòng)聚類出來(lái)的,這些人他們可能在現(xiàn)實(shí)生活當(dāng)中不認(rèn)識(shí),但是他們檢索信息的模式非常相近,這部分也會(huì)當(dāng)做檢索信息的內(nèi)容給出來(lái)。目前還是一個(gè)非常初級(jí)的階段,在Myspace的產(chǎn)品里面,我們目前僅僅是用到了推薦朋友,給他推薦新朋友,第二個(gè)是閱讀博客,或者閱讀論壇的時(shí)候,尤其是閱讀博客的時(shí)候,會(huì)給他再推薦一些其他的內(nèi)容,用到內(nèi)容推薦,這是目前非常初步的應(yīng)用。

  預(yù)計(jì)在明年年初的時(shí)候,我們和科研機(jī)構(gòu)第一期會(huì)出來(lái)一些成果,這些成果出來(lái)之后,會(huì)繼續(xù)的用在網(wǎng)站和手機(jī)版的推薦上面,應(yīng)該會(huì)再往前走一步。當(dāng)然真正從科研項(xiàng)目來(lái)說(shuō),時(shí)間是五年,我們還有四年時(shí)間,只是一個(gè)初步的,所以它仍然在發(fā)展。但是在企業(yè)上,在商業(yè)上的應(yīng)用應(yīng)該是已經(jīng)基本上能夠用了,成熟期還談不上,但是應(yīng)該是可以用了。存在的問(wèn)題就是潛在有隱私的問(wèn)題,當(dāng)這個(gè)研究目的,比如說(shuō)用戶的數(shù)據(jù)我們拿出去做分析,簽有關(guān)的保密協(xié)議等等這些東西,在中國(guó)畢竟用戶的隱私大家還不是那么在意,如果這個(gè)事在美國(guó)的話弄不好可能會(huì)被告了,但是做一個(gè)研究也是很無(wú)奈的事情。對(duì)于它的前景來(lái)說(shuō),我個(gè)人是非?春玫模?yàn)樗嬖诜浅4蟮男枨,讓用戶很快的找到信息,用戶的方便性。中?guó)之所以能夠樹立一個(gè)非常高的互聯(lián)網(wǎng)的門檻,跨國(guó)的互聯(lián)網(wǎng)公司進(jìn)來(lái)很多發(fā)展的不是很順利,和用戶的使用心理有很大的關(guān)系,中國(guó)的互聯(lián)網(wǎng)用戶非常懶,而且不主動(dòng),如果你不能夠主動(dòng)的把信息推到他的面前去看,讓他尋找去學(xué)習(xí)的話就非常難以成功。我們?nèi)ツ戤?dāng)時(shí)發(fā)布Myspace是原汁原味的產(chǎn)品,結(jié)果我們被罵得狗血淋頭,磚頭真的是滿天飛,有一個(gè)月時(shí)間我們壓力特別大,這也是中國(guó)互聯(lián)網(wǎng)公司的機(jī)會(huì),因?yàn)樗苯涌截愡M(jìn)來(lái)的話非常難以成功,Google是另外一個(gè)特例,Google的搜索之類的東西其實(shí)是非常簡(jiǎn)化了,但是如果在社區(qū)上面,在中國(guó)絕對(duì)需要這個(gè)方面的創(chuàng)新。目前我們做的個(gè)性化信息檢索項(xiàng)目不是Myspace全球做的,僅僅是Myspace中國(guó)自己開始的一個(gè)項(xiàng)目,在這方面是能夠提高用戶體驗(yàn)的一個(gè)方式。

  我的演講就到這里,謝謝大家,謝謝主持人,祝大家中午有一個(gè)好胃口。

搜狐IT



相關(guān)鏈接:
NTT Docomo張永生:移動(dòng)SNS的個(gè)性化與管理 2008-12-19
廣電總局易凱:手機(jī)電視的運(yùn)營(yíng)管理和應(yīng)用 2008-12-19
聯(lián)想移動(dòng)梁軍:移動(dòng)寬帶互聯(lián)網(wǎng)的未來(lái) 2008-12-19
谷歌中國(guó)總裁李開復(fù):移動(dòng)搜索精準(zhǔn)至關(guān)重要 2008-12-19
閔昊:應(yīng)用于手機(jī)移動(dòng)支付的硬件方案QSIM 2008-12-19

分類信息:     熱點(diǎn)專題_移動(dòng)增值_文摘   行業(yè)_移動(dòng)_文摘