亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

 首頁 > 新聞 > 專家觀點 >

2016語音技術產業(yè)一覽之輔助技術

2016-05-30 09:21:23   作者:   來源:CTI論壇   評論:0  點擊:


  CTI論壇(ctiforum.com)(編譯/老秦): 人類的聽、說、看的能力是上蒼賜予我們的禮物,而聽力受損,語言障礙和部分或全部失明是人類每天都要面臨的挑戰(zhàn)。語音識別技術正在幫助解決大多數情況下的這些問題。
  這些幫助改善“聽、說、看”能力的技術被人們寄予厚望,尤其在老齡化日益嚴重的今天。隨著年齡的增長,越來越多的人開始發(fā)生這些類型的障礙。
\
  更具體地說,根據美國疾病控制和預防中心(CDC)的數據,美國每年大約有750000人中風,又根據美國心臟協會(AHA)的數據,由此每年造成的死亡人數為129000.其他的數據則聲稱美國每年中風數高達100萬。中風在AHA的人類死亡原因中位列第五。根據美國國家失語癥協會和阿德勒失語癥中心的數據,目前美國的失語人數分別是100萬和200萬。根據美國國家失語癥協會的數據,每年有超過80000的美國人被診斷為失語癥。根據疾病防治中心的說法,目前有超過1000萬的美國人患有認知障礙。醫(yī)療保健的支出在美國和世界各地都呈上升趨勢,所以有更多的人比以往任何時候都更加需要獲得“聽、說、看”輔助設備。
  歷史最悠久、最公開的語音技術是語音合成技術,世界著名的物理學家和作家斯蒂芬·霍金利用這種技術進行交流?▋然仿〈髮W消費者科學教授Alan Black說,霍金使用的是某些30年前開發(fā)的基本系統,這些系統是為了那些失去了他們的聲音和那些從來沒有聲音的人們而開發(fā)的。
  通過使用一個嵌入在他的臉頰中的小傳感器激活,霍金“類型”字符和數字通過一個語音生成設備(SGD)產生出經過合成過的語言;艚鸬脑O備是由now-defunct Speech Plus。開發(fā)的。這家公司是目前這類設備的最大制造商,位于美國的匹茲堡。它是基于DynaVox公司的LLC系統,一家Tobii科技公司。
  霍金的設備使用了一個具有美國口音的機器人聲,而霍金是英國人,DynaVox公司和其他公司提供各種各樣的聲音,以便可以合成個性化的語言。
  租賃你自己的聲音
  進一步的幾個步驟使輔助語音系統利用你自己的聲音錄音,這樣復制的演講聽起來就像個人在使用設備。
  這樣的設備在市場上最著名的就是影評人羅杰·艾伯特(Roger Ebert)使用的了,他是第一個使用語音合成器發(fā)出伊利諾伊英國口音的人。艾伯特因為癌癥切除了他的下巴,從而失去了說話的能力。
  艾伯特最終被CereProc CereVoiceMe的聲音克隆服務所吸引。起初他不喜歡它,因為他不認為這個聲音聽起來像他自己的聲音,盡管它來自于30年代的電視節(jié)目和廣播節(jié)目錄音。艾伯特不認為聲音是他自己的原因是因為你錄制的聲音不同于你所聽到的聲音。當你說話的時候,是頭骨和鼓膜振動的合成。聽錄音時,只聽到通過鼓膜振動的那部分。
  那些知道正在失去講話能力的人們往往會利用今天不同公司所提供的語音克隆技術記錄幾個小時自己的聲音。通常,更多的記錄時間可以使自己的聲音更自然的再現,也會因為更多的詞形變化和其他說話時的細微差別而原音重現。當然,更強大的解決方案所需費用也更高。
  Lingraphica最近增加了即時消息和電子郵件功能,這給它的7英寸minitalk模型機和13英寸筆記本電腦模型機帶來了每日新聞摘要。
  “這是一個非常有趣的時代,而我們公司有著獨特的優(yōu)勢,”Lingraphica公司創(chuàng)新、銷售和營銷部門副總裁Michelle Hart-Henry根據前面提到的健康數據評論道。該公司為語言障礙提供設備和語言治療解決方案,致力于解決那些康復問題。
  “中風的發(fā)病率增長,而存活率也增加了,”Hart-Henry說。“同時,人們正越來越相信中風六個月后恢復的可能性。”
  隨著新生代的增長,這樣的認知問題也將繼續(xù)增加,Hart-Henry補充道。“他們需要這些設備。如果他們沒有這樣的需求,他們的孩子們也會有。他們希望處于不斷發(fā)展的技術之巔。”
  超出了公司的傳統產品,Hart-Henry期望她的公司和其他公司為語言障礙群體提供技術和環(huán)境以及其他科技設備,讓人們在日常生活中得到使用。
  通過電話幫助聽障群體自由溝通
  盡管今天的消費者使用智能手機的時間遠遠超過了使用普通電話,但對于許多人來說,電話仍然是重要的,尤其是當與朋友和家人交流的時候,RogerVoice的CEO Olivier·Jeannel如是說。這家公司提供了幫助聽力受損群體在電話溝通時的解決方案。
  利用與谷歌語音的接口,為這些客戶提供了字幕服務。產品的市場相對較小,根據Jeannel的說法,有聽力損失的百分之一和有深度或聽力完全損失的千分之一的人群才會用到這項服務。
  利用RogerVoice的產品和服務,耳背的人可以使用電話聯系親人,在這里電話仍然是主要的通信工具---- 百分之九十的電話都是打給朋友和家人的,Jeannel說。
  雖然幫助聽力受損人群溝通的技術是基于提供字幕服務,一個不同的技術則來自于MotionSavvy UNI,它結合了手勢和語音識別技術,將手語翻譯成語音。該技術有望在2016年中期實現。
  Ava,一項使用語音技術的字幕工具,預計也將在2016年的某個時期首次亮相。
  新的、更強大的技術幫助視力受損群體
  視障需要朗讀文本的技術,今天這個功能可在大多數操作系統上實現,Black說。應用程序有能力跳過廣告并提供基于屏幕文本的快速語音交流。
  Nuance的TALKS軟件應用程序將文本轉換為可理解的語音,這個應用程序是與Nuance ZOOMS的緊密集成,屏幕放大器應用程序使得低視力用戶手機可以訪問手機屏幕上的內容。
  還有一些為盲人服務的先進技術,從簡單的閱讀屏幕上的文字到對于在屏幕上的圖片內容進行描述。
  Conversant的創(chuàng)始人兼首席執(zhí)行官ChrisoMaury,四年前逐漸視力減弱,他很不滿意當時他在市場上看到的技術和產品,因為他想要的不僅僅是語音。“我想構建我想要的東西。”
  所以他發(fā)明了SayKit軟件開發(fā)工具包(SDK),一個面向C語言和Swift框架的,增加了與iOS應用程序的會話交互。SDK使用會話語音,使應用程序用戶可以簡單地說“搜索…”,而不是提供更少的自然語音指令。
  “這將是未來的客戶互動,”Maury說。
  Conversant最近與Target聯合發(fā)布了一個應用程序,名為Say Shopping,它使用戶能夠說出他們想要的產品。這款應用程序搜索Target的整個產品目錄,使用戶能夠聽到關于產品的詳細信息和用戶評論。客戶可以訂購產品。Conversant正與Target一起研發(fā)如何為購買雜貨的顧客服務。
  根據Maury的說法,此應用程序已經被下載它的人群中的一半以上的人所使用。
   聲明:版權所有 非合作媒體謝絕轉載
分享到: 收藏

專題