智能語音開啟萬物互聯大門
  來源:黑龍江日報客戶端  作者:劉慶峰
2019-06-17 14:52:17

demo.jpg

《智能語音時代》

[美]詹姆斯·弗拉霍斯/著

苑東明/譯 電子工業出版社

一位被診斷為患有晚期肺癌的父親,在生命末期,為孩子留下了91970個單詞的口述。孩子打造了一臺爸爸機器人,讓父親在聲音的世界里“永生”——這個孩子就是本書的作者。這個令人動容的故事讓我們感受到語音的溫度和科技的溫暖。

在中國,科技也在創造著這樣的溫暖。2018年年初,在全球首部利用人工智能配音的紀錄片《創新中國》中,我們合成了中央電視臺已故配音大師李易的聲音,用技術向藝術致敬。

語音,是人類呱呱墜地后最早使用的溝通方式,也是現代人際交流最基本的方式,更是未來人機交互最重要的方式。人工智能跌宕起伏發展60多年,智能語音是發展到今天最為成熟、也是最重要的板塊之一。“最近的一次范式轉移正在進行中。”作者在書中提到,這次轉移正是關于智能語音的。

全書分四個部分,第一部分“競爭”,講述智能語音時代的競爭之戰和范式轉換,解密蘋果、亞馬遜、谷歌、臉書、微軟等科技巨頭的智能語音布局與商業角逐;第二部分“創新”,講述智能語音的技術探索和創新之路,探索了語音人工智能的技術突破、個性設計和交談能力;第三部分“革命”,講述智能語音的革命之路,探索了語音人工智能的情感陪伴、超級智能、隱私風險和虛擬永生;第四部分“最后的計算機”,預測了智能語音的未來,并探討了它將如何改變世界。

在互聯網發展的下半場,我們將進入萬物互聯的新時代。隨著越來越多的設備在無屏、移動、遠場狀態下被使用,作為人類最自然、最便捷的溝通方式,語音將會成為所有設備至關重要的入口。未來,我們將迎來以語音交互為主、鍵盤觸摸為輔的全新的人機交互時代,人和機器之間的溝通,可能完全是基于自然語言的,你不需要去學習如何使用機器,只要對機器說出你的需求即可。

比如在導航軟件中,你能聽到各種明星的合成聲音;在電視上,你能看到虛擬主播播報的多語種新聞;在居家生活中,你能通過語音控制音樂、燈光、溫度,實現智慧家居;甚至在醫院里、社區里,你能用語音調動機器人幫你辦理事項……智能語音是通向萬物互聯時代的必經之路,它的存在讓交互方式擁有無限的可能,也讓這個時代更具人性的溫度。

20世紀90年代,我在就讀于中國科學技術大學時被選進人機語音通信實驗室,研究“如何讓機器像人一樣開口說話”。那時,團隊的一個夢想是研發一臺能自動翻譯的電話,即使交流時語言不通,通過人工智能技術也能讓我們無障礙地交流;20多年后的今天,我們自主研發的翻譯機已經支持中文與50種語言的實時翻譯,每個月總共為全球提供超過5000萬次服務。智能語音讓被地域、文化等因素隔離的人們也能無障礙地溝通。

此外,我們通過技術在聽障和視障人群間搭起溝通的橋梁,讓聽障群體通過語音識別技術“看得見”聲音,讓視障群體通過語音合成技術“聽得見”文字。2017年我們發布了“三生有幸”公益計劃,目前已有幾十萬殘障人士受益,語音轉寫、語音朗讀為他們獲取信息帶來了極大便捷。

在以語音為主、鍵盤觸摸為輔的萬物互聯時代,人們對語音交互提出了更高的技術期待與需求。今天,雖然在安靜、發音標準的情況下,中文的語音識別準確率已經可以達到98%,英文的語音識別準確率可以達到95%,但在有方言、噪音、口音和遠場的情況下,距離語音識別高準確率或許還有很長一段路要走。這本《智能語音時代》,作者對語音技術的發展趨勢有著深刻洞察,從Sir i誕生到谷歌助理、亞歷克莎的規模化應用,以翔實的資料、細致的文筆講述智能語音時代的到來及其可能帶來的影響。

編輯:肖笛 責編:趙宇清

安徽快三走势图分布图 10年内最赚钱的新兴行业 360老快3开奖结果 pk10是怎样的骗局 几十台苹果 赚钱 排列五选100 我赚钱了虾米音乐 缅甸龙虎技巧 股票配资排名ˉ选杨方配资给力 有没有苹果软件赚钱的 七乐彩历史号码大全 黑龙江11选5选号技巧 北京赛计划软件那个最好 2019年养殖小龙虾能赚钱吗 宝赢系统时时彩app 麻将万条筒具体怎么玩 网络捕鱼赢钱游戏