亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

您當前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

美的科技月 x 思必馳丨聲動無限 共話未來

2020-10-15 10:13:38   作者:   來源:CTI論壇   評論:0  點擊:


  9月24日,第25屆美的科技月系列活動在美的創(chuàng)新中心展開。思必馳作為美的技術合作伙伴應邀參加,并協同舉辦了“聲動無限·共話未來”的主題論壇。本次科技月活動,思必馳分別帶來產品方向、技術路線方面的分享,進一步加深與合作伙伴的了解及增強雙方互動。
  以下內容由思必馳轉寫一體機記錄并轉寫。思必馳智能會議轉寫系統,自從開會用上它,職場“社畜”早回家!
  1、思必馳人工智能語音技術簡介
  分享環(huán)節(jié)中,思必馳商務總監(jiān)申曉宇率先為參會人員介紹思必馳公司概況及主要產品技術、解決方案。思必馳一直以來專注于語音交互核心技術不斷升級以及AI+行業(yè)的商業(yè)落地,同時也擁有產業(yè)基金來孵化不同行業(yè)場景下的商業(yè)化應用,以擴大思必馳在整個行業(yè)里的布局。
  思必馳目前為合作伙伴提供全渠道的智能服務,主要集中在IoT、智能家居、智能車載、智能電子、機器人等領域。同時,思必馳業(yè)務范圍也逐漸覆蓋智慧金融、智慧醫(yī)療、智慧物流、智慧酒店等場景。
  目前,在整個IoT場景及車載場景市場占有率里,思必馳以亮眼數據占據了行業(yè)領先地位;同時,智慧城市、智慧政務、智能客服等也是思必馳所嘗試的戰(zhàn)略發(fā)展新方向。細化AI+行業(yè),以AI賦能全行業(yè),是思必馳一直以來的用心所在。
  2、端側專用芯片——AI算法的理想載體
  思必馳全資子公司——深聰智能芯片總監(jiān)查亮則對思必馳端側專用AI芯片做出了更詳細的闡述。
  根據IDC預測,2021年全球AI生態(tài)市場規(guī)模將超過520億美金;2021年全球AI生態(tài)系統的發(fā)展態(tài)勢,AI芯片迎來了新的發(fā)展機遇及挑戰(zhàn),軟件定義芯片的時代已經來臨。在傳統通用芯片市場上,芯片可匹配的應用場景很多,對算力要求不高,可以適配多種產品,但是通用性強可能導致芯片的專業(yè)性較弱。此外在市場層面,從最初的產品定義到軟件功能、硬件設計,及最后的用戶體驗,能夠給用戶帶來一套完整芯片方案是當前比較剛性的需求。所以軟硬件的結合,是更符合市場趨勢的一個產品方向。
  深聰智能自研發(fā)的TH系列芯片作為思必馳語音算法與芯片的完美結合,令客戶在選擇對傳統產品進行智能化改造時擁有了更多樣化、更靈活的軟硬一體解決方案。深聰智能第一代芯片TH1520已量產上市并落地諸多案例,下一代芯片在開發(fā)中針對算法、架構、物理實現了IP優(yōu)化,多模態(tài)視覺識別也在規(guī)劃中。
  3、語音前端信號處理技術
  在全鏈路語音技術分享環(huán)節(jié)中,思必馳前端信號處理負責人周強認為,語音交互仍面臨著遠場拾音、多聲道同步采集、回聲消除、去混響、平穩(wěn)噪聲降噪、自動目標偵聽和喚醒、目標聲源波達方向估計、目標聲源波束形成和干擾抑制等諸多聲學場景挑戰(zhàn)。信號處理可以提升語音的可懂度和信噪比,用來提升人人交互和人機交互的性能。
  思必馳在遠場語音通話、遠場語音喚醒識別等方面都有自己的一套處理算法,在不同的系統中做好降噪量和失真的權衡問題也有著比較充足的實戰(zhàn)經驗。在談到思必馳所掌握的核心基礎技術時,周強著重介紹了波束成形技術及盲源分離技術的技術原理及關鍵指標。
  技術終將凝練成產品再系統形成成熟方案,基于過硬的全鏈路語音技術,周強也簡要介紹了思必馳的遠/近場交互方案。近場交互方案多應用于智能客服終端、機器人、自動售賣機等案例中,它采用大陣列近場模型,對角度和距離進行建模,能有效去除范圍外的噪聲干擾。遠場交互方案則廣泛用于家居場景中,目前思必馳遠場交互方案配合麥陣方案,可實現遠場3~5米識別率在94%以上。
  4、思必馳ASR(++)技術與平臺化應用
  思必馳語音識別技術總監(jiān)薛少飛則從語音識別技術(ASR)、語音富信息技術(ASR++)以及語音技術平臺化幾個方向分享了思必馳的技術和產品思路。
  卷積神經網絡(CNN)應用到語音識別中由來已久,最早應用在圖像識別領域,大約在2014年引入到語音識別領域。利用CNN將整個語音信號分析得到的時頻譜當作一張圖像一樣來處理,采用圖像中廣泛應用的深層卷積網絡對其進行建模;從實用性上考慮,CNN也比較容易實現大規(guī)模并行化計算。在深度學習領域,思必馳聯合實驗室推出極深卷積神經網絡(VDCNN)在識別魯棒性上展現出巨大的優(yōu)勢。產學研一體化之下,思必馳語音識別準確率高達98%,并具有反饋速度快、快速定制、強魯棒性等優(yōu)勢,這得益于思必馳語音算法的行業(yè)前瞻性及先進性。
  語音識別支持通用以及包括金融、教育、音視頻等在內的領域場景,同時也提供語音識別自定制能力,賦能客戶自主優(yōu)化應用場景中的識別體驗;即使在本地也可以支持普通話、方言以及外語小語種的識別。而語音副信息技術則在語音識別基礎上加上了富信息識別,例如說話人、情緒、年齡、性別等。
  目前思必馳語音富信息技術已落地至IoT、智能客服、金融安全、會議轉寫、國防安全等場景。作為對話式AI平臺型公司,思必馳在語音技術平臺化方面也做了很多工作,推出的DUI平臺可面向物聯網場景進行智能對話交互的定制化輸出,會話精靈則作為企業(yè)虛擬機器人定制平臺,幫助企業(yè)快速定制專屬服務和解決方案。
  5、全雙工及多模態(tài)交互技術
  思必馳全鏈路語音技術為各行各業(yè)智能交互添磚加瓦的同時,全雙工交互貫穿始終。思必馳對話組負責人樊帥指出,在過去半雙工狀態(tài)下,用戶的跨領域交互每次交互都需要重新喚醒,而現在,思必馳全雙工技術方案可實現一次喚醒,在多個領域持續(xù)交互,跨領域指代消解。不僅如此,全雙工語音交互可以結合專業(yè)領域知識庫實現智能語義糾正、支持多領域的模糊信息確認、打破沉默主動交互、根據用戶說話節(jié)奏和內容動態(tài)斷句等。
  全雙工交互技術的提升涉及到對話系統的各個模塊,不僅各個模塊的功能性、穩(wěn)定性需要提升,對各模塊間的配合也提出了更高要求。思必馳專注人性化的智能語音技術,依托DUI平臺,思必馳全雙工與當前全鏈路語音技術全面兼容,客戶可以選用思必馳全鏈路技術或采用云對云的方式接入全雙工。
  此外,樊帥提到多模態(tài)交互將極大提升人機交互體驗,他現場演示了一段視頻,展示多模態(tài)交互中的人臉拒識可以將非喚醒人的指令過濾,指令執(zhí)行有條不紊。多模態(tài)交互可讓全雙工交互技術發(fā)揮更大的能量,配合聲紋識別、圖像處理等技術,過濾無用信息,人機交互會變得更加貼合人性,這也是未來思必馳發(fā)力的方向。
  6、語音技術在IoT場景的應用
  成立至今,思必馳以AI賦能多種IoT產品,覆蓋了包括音箱、電視、穿戴、白電、故事機、廚電在內的多種IoT設備,為實現物聯網的智慧互聯而不懈努力。
  思必馳IoT產品負責人于鵬偉從語音交互流程出發(fā),簡單系統解釋全鏈路的概念。說話人說話通過陣列采集形成原始音頻,進入到信號處理模塊,包括回聲消除、降噪等流程,然后獲得一段相對純凈的音頻。這時通過本地語音識別進入到本地語音播報并傳達給說話人;或者通過云端語音識別進入到自然語言理解模塊、對話管理、自然語言生成,最后再文字轉語音傳達給說話人。
  基于關鍵全鏈路語音技術,思必馳的近/遠場方案可以滿足智能客服、家居等多樣化場景需求。思必馳算法技術中的就近喚醒、聲紋識別、方言識別、通話降噪、圖像與多模態(tài)皆達到行業(yè)領先水平;此外,思必馳算法模型也已通過亞馬遜驗證標準測試,成為亞馬遜前端軟件推薦供應商,可協助合作客戶通過AmazonAlexa實驗室聲學認證測試,將來可為本土廠商發(fā)展海外市場、優(yōu)化多語言模型提供強大技術支持。
  7、聲動無限共話未來
  美的科技月活動始于1996年,在美的集團內部素有“科研奧斯卡”之稱,一直被美的視為科技創(chuàng)新實力和科技人員風采的內部展示與交流平臺。
  思必馳與美的集團的合作由來已久,近日更是與美的集團共同創(chuàng)立“AI聯合研究實驗室”,旨在攜手打造全鏈路智能家居生態(tài)平臺。未來,雙方也將在創(chuàng)新研發(fā)、產品更新、市場拓展等方面不斷深化合作,共建雙贏格局,推進未來設備數字化與智能化升級。
 
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

CTI論壇會員企業(yè)

滦南县| 鸡泽县| 上蔡县| 永和县| 汝州市| 梅州市| 江阴市| 南京市| 阳泉市| 来安县| 精河县| 永清县| 肃北| 隆安县| 鹤岗市| 中阳县| 文化| 忻城县| 福建省| 凤翔县| 昌吉市| 裕民县| 马山县| 天祝| 宝丰县| 沽源县| 麻城市| 托克逊县| 延长县| 开封市| 积石山| 禄丰县| 崇仁县| 德化县| 大竹县| 双鸭山市| 蒙山县| 泗洪县| 巴中市| 永州市| 灵丘县|