8月23日-8月25日,以“智能化:為經(jīng)濟賦能,為生活添彩”為主題的首屆中國國際智能產(chǎn)業(yè)博覽會在重慶舉行,在這一國家級展會中,包括谷歌、微軟、英特爾、騰訊、搜狗等500余家全球領(lǐng)先企業(yè)紛紛亮相,展示全球大數(shù)據(jù)智能化領(lǐng)域新產(chǎn)品、新技術(shù)、新業(yè)態(tài)和新模式。
在國內(nèi)外前沿科技云集的智博會現(xiàn)場,搜狗首次全面展示多領(lǐng)域、九大AI科技成果,主打趣味又實用的AI黑科技,成為本屆智博會最“吸睛”展臺。
AI換臉術(shù)? 人臉遷移讓人人都能七十二變
搜狗展臺全場風頭最盛的,當屬搜狗“人臉遷移”體驗區(qū)。觀眾只要選擇自己喜歡的明星,鏡頭便會捕捉觀眾的人臉并與明星臉進行融合,生成專屬觀眾的“明星臉”。從娛樂圈頂級男神彭于晏,到宅男女神林志玲,到當紅小花迪麗熱巴,再到今夏爆火《延禧攻略》強勢女主“魏瓔珞”(吳謹言),秒變多位明星的“換臉”體驗吸睛無數(shù),引得眾多參展者體驗拍照圍觀。當看到該技術(shù)除了“換臉”,還可以動態(tài)捕捉屏幕中的人臉,隨人臉動作而隨之變動后,體驗者紛紛感嘆“真是太厲害太神奇了”。
(搜狗人臉遷移技術(shù)體驗區(qū))
據(jù)了解,搜狗人臉遷移技術(shù)結(jié)合了人臉識別、三維人臉擬合、表情控制等多項前沿技術(shù),能瞬間完成“換臉”體驗,并可實現(xiàn)面部實時動態(tài)變化效果,跟隨用戶的臉部動作,完成多種表情、口型的變化。未來,該項技術(shù)還可以運用在直播、視頻互動、影視制作以及教育等豐富場景中。
AI讀唇術(shù)讓科幻片場景成現(xiàn)實
除了人臉遷移技術(shù),唇語識別技術(shù)體驗區(qū)也是搜狗展臺的一大熱門?,F(xiàn)場觀眾只需對著大屏幕默聲說出一句話,如古詩“長風破浪會有時,直掛云帆濟滄海”,無需發(fā)出聲音,機器就能通過面部識別和唇型特征讀出對應(yīng)的發(fā)音,識別其說話內(nèi)容,并生成文字呈現(xiàn)于大屏幕。這一互動,讓在場觀眾親身體驗了一把“不發(fā)聲,只動嘴,就知道你在說什么”的一大開掛技能。
(搜狗唇語識別技術(shù)體驗區(qū))
唇語識別技術(shù)是一項集機器視覺與自然語言處理于一體的世界前沿技術(shù)。經(jīng)過數(shù)千小時真實唇語數(shù)據(jù)訓練,搜狗“唇語識別”系統(tǒng)在垂直場景命令集,如車載、家居等場景下已達到90%的識別準確率??梢灶A見,在殘障教育和公共安全等不易捕捉語音、不易了解語義的情況下,唇語識別技術(shù)將大有作為。
“說”“唱”俱佳 AI語音合成再升級
隨著如今語音技術(shù)的逐漸成熟,語音合成技術(shù)已較為常見,但這次的智博會上,搜狗卻帶來了高定版的個性化語音合成。搜狗語音合成技術(shù)通過少量數(shù)據(jù)即可生成該說話者的合成音色,現(xiàn)場觀眾可以體驗到由幾近真人的AI合成聲音,如合成搜狗CEO王小川的聲音來播報消息以及演唱歌曲。
值得一提的是,搜狗目前已實現(xiàn)語音風格遷移?,F(xiàn)場選擇王小川的音色后,再匹配歌曲《藍精靈之歌》,通過風格遷移技術(shù),最終能生成王小川版《藍精靈之歌》。這版歌曲中既包含了歌曲的曲調(diào)和節(jié)奏,也融入了王小川的聲線及語言風格,生動有趣地呈現(xiàn)了搜狗語音合成和風格遷移技術(shù)。
據(jù)了解,搜狗基于深度神經(jīng)網(wǎng)絡(luò)的新一代合成引擎,目前已支持中英文、男女等二十多個音色的合成,而搜狗個性化語音合成技術(shù)僅使用個人10分鐘左右的語音數(shù)據(jù),即可訓練生成具有該說話人特色的音色,合成效果處行業(yè)領(lǐng)先水平。今年搜狗初次征戰(zhàn)國際頂尖語音合成大賽——“Blizzard Challenge 2018 ”即斬獲2項冠軍,技術(shù)實力驚艷全球。
AI虛擬主播現(xiàn)場報道
除以上幾項令人驚艷的AI黑科技外,全球首個高度定制化的搜狗虛擬主播技術(shù)這次也來到重慶,為觀眾進行現(xiàn)場報道。在虛擬主播體驗區(qū),屏幕上生成電視臺主持人播報新聞的視頻,播報效果與真人無異。
未來,該技術(shù)還將應(yīng)用在線上教學、直播、視頻互動、影視制作等豐富場景中,搜狗亦在不斷探索與未來生活的連接點。
AI+醫(yī)療 讓權(quán)威、真實有效的醫(yī)療信息觸手可得
在搜狗明醫(yī)智能分診體驗區(qū),搜狗“分診助手小汪”也收獲了不少粉絲。參展者可以通過與小汪互動,了解自己可能患有的病癥。比如,有體驗者告訴小汪“肚子疼”時,它會詢問具體的癥狀細節(jié),并根據(jù)體驗者的癥狀描述,給出相應(yīng)的病癥判斷,并建議前往相關(guān)科室就診,不少體驗者紛紛感慨“小汪很厲害,這項功能很是實用”。作為搜狗獨家首創(chuàng)的、將AI技術(shù)與醫(yī)療搜索創(chuàng)新結(jié)合的一項功能,搜狗明醫(yī)智能分診功能,通過模擬醫(yī)生與患者對話的模式,針對性別、年齡、病癥等問題與體驗者展開多輪對話,為用戶提供了癥狀初步診斷和醫(yī)院分診等貼心服務(wù)。
除了智能分診服務(wù)外,搜狗明醫(yī)一直秉承“讓權(quán)威、真實有效的醫(yī)療信息觸手可得”的理念,今年新整合了全球700余家權(quán)威健康網(wǎng)站的近千萬優(yōu)質(zhì)內(nèi)容,讓海內(nèi)外權(quán)威健康信息得以更快捷精準地傳遞給億萬用戶,為用戶了解病情提供更多便利。
兩大AI翻譯硬件親測 網(wǎng)紅出國必備神器
硬件方面,搜狗今年大熱的兩大AI翻譯硬件——能支持42種語言互譯的“搜狗旅行翻譯寶”和33種語言對話翻譯的“搜狗錄音翻譯筆”,也亮相本次智博會。在語音識別、圖像識別、AI機器翻譯、語音合成等多重人工智能技術(shù)的加持下,搜狗的AI翻譯機已成為“便攜翻譯官”,吸引了現(xiàn)場諸多外國友人光顧展臺,讓外國友人通過翻譯機就能完成對話,體會外文對中文的翻譯效果。
糖貓兒童智能硬件則是搜狗另一明星產(chǎn)品,它可以實現(xiàn)視頻通話、實時電話、精準定位、一鍵拍照等諸多實用功能,而這也吸引了眾多家長的咨詢與試用。
此外,搜狗語音識別體驗區(qū)也不走尋常路,通過繞口令等好玩的挑戰(zhàn)互動游戲,讓參展者體驗搜狗的語音識別技術(shù),帶動現(xiàn)場氣氛High到停不下來。當前,搜狗語音識別準確率已高達98%,依托該技術(shù),即使是夾雜著各地口音的繞口令這種高難度語音,搜狗智能語音識別技術(shù)都能準確將其轉(zhuǎn)化為文字。同時,對于技術(shù)無法達到的最后2%的準確率,搜狗還業(yè)內(nèi)首創(chuàng)語音修改功能,通過自然語言交互的形式修改所輸入的文字,為用戶提供了解放雙手的智能輸入體驗??梢哉f,搜狗智能語音識別功能是非常貼心了。
自智博會開幕以來,S3館中的搜狗展區(qū)始終人頭攢動,驚嘆聲不斷。從“秒變明星臉”,到“唇語識別”,再到“出國翻譯神器”等,搜狗九大AI黑科技不僅全方位展現(xiàn)了搜狗語音、圖像、問答、翻譯等多領(lǐng)域AI成果,更讓參展者切身體會到AI技術(shù)對外貌、交流方式、安全等生活各方各面帶來的改變與便利。未來,搜狗還將持續(xù)發(fā)力人工智能,在提升技術(shù)水平的同時,逐步滲透行業(yè)上下游,“軟硬結(jié)合”,持續(xù)推動中國智能產(chǎn)業(yè)發(fā)展,連接智能生活。