抱著對人工智能的極大興趣,我這樣一位大叔,意外的遇到一個機器人蘿莉…。一切都是個意外!這個機器人蘿莉就是京東客服機器人JIMI,我更想把它叫做京東機密。
在某個場合,我見到了京東深度神經(jīng)網(wǎng)絡實驗室(DNN Lab)首席科學家李成華,這位擁有博士后學位的深度學習領(lǐng)域的頂級專家,正在人工智能和機器學習領(lǐng)域進行研究。而京東JIMI,正是他創(chuàng)造出來的智能機器人,目前的工作是在售前咨詢、售后服務和生活伴侶三個場景,承擔超過30%的京東客服任務。
帶著對JIMI的好奇心,就產(chǎn)生了這段對話.jIMI的答復很有趣:它是一個蘿莉?墒,難道所有的智能機器人都具有類似的邏輯反應嗎?顯然,另一個業(yè)界知名的機器人“某小二”的反應卻略顯生澀,讓我這位大叔頓時失去了搭訕的欲望。
看來,機器學習再到深度學習,反映在智能機器人身上的效果還真是相差很大。
那么,問題來了,什么是深度學習,它跟傳統(tǒng)的智能機器人為什么差別那么大?
深度學習 小蘿莉的神經(jīng)網(wǎng)絡
簡單說,深度學習是模擬人腦進行分析學習的神經(jīng)網(wǎng)絡,它模仿人腦的機制來解釋和處理各種數(shù)據(jù),包括文本數(shù)據(jù)、圖像數(shù)據(jù)和語音數(shù)據(jù)等。
而深度學習和普通的機器學習的最大區(qū)別就就是:神經(jīng)網(wǎng)絡的層數(shù)。
傳統(tǒng)神經(jīng)網(wǎng)絡一般只有兩三層的神經(jīng)網(wǎng)絡,其有限的參數(shù)和計算單元,對復雜函數(shù)的表示能力有限,學習能力有限;而深度學習則具有5到10層的神經(jīng)網(wǎng)絡。為什么JIMI能夠達到這樣的智能,李成華說,京東的深度學習已經(jīng)能夠做到8到9層。
對比傳統(tǒng)的神經(jīng)網(wǎng)絡,傳統(tǒng)神經(jīng)網(wǎng)絡在大數(shù)據(jù)量的學習上性能較差,不符合大數(shù)據(jù)所需的時效性。另一方面,大數(shù)據(jù)的演進催生了軟硬件系統(tǒng)的進步,分布式架構(gòu)的產(chǎn)生,使得算法的性能已經(jīng)不是瓶頸,并行化框架和訓練加速方法,讓深度學習的前景變得光明。同時,大數(shù)據(jù)也會讓深度學習的效果越來越好。所以,從某種意義上說,深度學習是大數(shù)據(jù)的最佳拍檔。
可是,目前深度學習也有很多的困難。最為突出的就是人才稀少,李成華說,學這個專業(yè)的人才本身就少,能夠建立起一個實驗室的專家資源,甚至需要從全世界去尋找,京東的深度學習實驗室的8位專家就來自于全球各地。可見,深度學習,還沒有廣為人知,做深度學習的專家更是鳳毛麟角。
那么,問題又來了。京東把這么難找的一群專家聚集在一起,要做什么?
大數(shù)據(jù)價值 蘿莉也有長大時
其實,京東之所以能夠進入深度學習的領(lǐng)域,首先得益于開放生態(tài)系統(tǒng)的構(gòu)建,和擁有的龐大的業(yè)務量并積累了較為完善的數(shù)據(jù)。李成華說“我們數(shù)據(jù)比較突出,從大數(shù)據(jù)來說京東的數(shù)據(jù)可能是所有電商中數(shù)據(jù)鏈最長的,包括經(jīng)銷商的數(shù)據(jù)、用戶一開始瀏覽我們的數(shù)據(jù),可能別的電商有,最后我們做到客服有沒有返修,返修的時候跟我們?nèi)私换サ臅r候他的情緒是什么樣的,這是別的平臺他們沒有的,因為他們服務不是自己做的,我們推送服務全是自己做的,所以京東對用戶數(shù)據(jù)掌握非常全,所以我們的描述也是最準的。”
其次,京東雖然有近5000人的人工客服團隊,但應付618或者雙十一大促仍然顯得捉襟見肘。2012年12月,京東開始籌劃成立JIMI智能客服團隊,通過一些機器算法模擬人的思維,達到客服跟用戶交流的效果。隨后深度學習技術(shù)的研究,加深了京東完善JIMI的想法。
直到2014年9月9日,京東成立了京東深度神經(jīng)網(wǎng)絡實驗室(DNN Lab),旨在通過神經(jīng)網(wǎng)絡、知識層次、異構(gòu)計算等新興領(lǐng)域的研究和應用來確保京東技術(shù)的領(lǐng)先性,提高JIMI的智能性及其應用的廣泛性是實驗室的首個直接目標。目前JIMI,已承擔超過30%的京東客服任務,但李成華希望未來JIMI可以包攬至少80%的客服工作。
看來小蘿莉也會有長大成人的時候。
JIMI的成長也許是電商的未來
其實,在文章開頭并沒有引用這段有趣的對話。我和JIMI還用這樣的對話,針對李成華的性別開了個小玩笑。玩笑歸玩笑,作為JIMI的創(chuàng)造者,李成華也可以說是JIMI之母。這個答案不知道李sir會不會滿意呢?
李成華的深度學習實驗室直接隸屬于京東副總裁馬松,而馬松本人是電商及人工智能領(lǐng)域的資深專家,在美國日本做過多年的研究,其他8名成員也是來自全球知名高校、企業(yè)和研究機構(gòu)的技術(shù)精英,具有多年的實踐經(jīng)驗和技術(shù)積累。目前,實驗室正從意圖識別,命名實體識別,自動問答和用戶畫像四個方向進行研究。
全球最有名的的深度學習技術(shù)首推IBM Watson,之后google和微軟等公司也把很多技術(shù)研發(fā)放到上面。在京東布局JIMI的同時,阿里也在積極布局深度學習實驗室。這說明,深度學習和數(shù)據(jù)挖掘技術(shù)已經(jīng)被電商企業(yè)視為核心競爭力,也許JIMI成長到承擔咨詢業(yè)務量80%的時候,深度學習的智能機器人就真正成為電商平臺的未來。
未來?誰知道好萊塢電影里的機器人時代,會不會真的變成未來呢!