科大訊飛iFLYHOME OS正式進(jìn)入2.0階段

11月19日,第五屆世界聲博會(huì)暨2022科大訊飛全球1024開發(fā)者節(jié)AI+家庭論壇在合肥奧體中心舉辦,現(xiàn)場(chǎng)發(fā)布推出以AI虛擬數(shù)字人為媒介的新一代電視語(yǔ)音平臺(tái)——iFLYHOME OS 2.0。iFLYHOME OS是科大訊飛針對(duì)家庭場(chǎng)景及智能終端開發(fā)的AI多模態(tài)人工智能操作系統(tǒng)。此次iFLYHOME OS 2.0以AI虛擬數(shù)字人為媒介,對(duì)多模態(tài)交互系統(tǒng)進(jìn)行了全面能力提升,并帶來(lái)了三大創(chuàng)新亮點(diǎn),讓大屏交互更便捷、更智慧、更溫暖。


(相關(guān)資料圖)

伴隨智能終端和ICT技術(shù)的蓬勃發(fā)展,智慧家庭新時(shí)代正在撲面而來(lái)。2021年12月,業(yè)內(nèi)首個(gè)雙編號(hào)標(biāo)準(zhǔn)《智能家居系統(tǒng)跨平臺(tái)接入與身份驗(yàn)證技術(shù)要求》正式發(fā)布,有效解決當(dāng)前智能家居互聯(lián)互通中存在的“生態(tài)壁壘”問(wèn)題,助推智能家居互聯(lián)互通產(chǎn)業(yè)的進(jìn)一步規(guī)范發(fā)展。面對(duì)廣闊前景空間,智慧家庭市場(chǎng)將深度聚焦平臺(tái)、應(yīng)用、技術(shù)、場(chǎng)景探索智慧家庭生態(tài)構(gòu)建,不斷完善服務(wù)化水平。

訊飛智慧家庭作為科大訊飛垂直行業(yè)品牌,以人工智能技術(shù)深度賦能運(yùn)營(yíng)商數(shù)字家庭業(yè)務(wù)及終端設(shè)備。在2016年發(fā)布首款電視語(yǔ)音助手,開啟大屏入口探索,2020發(fā)布電視語(yǔ)音平臺(tái)iFLYHOME OS,聚焦平臺(tái)生態(tài)能力建設(shè)。此次發(fā)布的iFLYHOME OS 2.0則標(biāo)志著大屏交互從語(yǔ)音邁入多模態(tài)新時(shí)代。

關(guān)鍵核心技術(shù)突破帶來(lái)交互體驗(yàn)升級(jí)

全新發(fā)布的iFLYHOME OS 2.0在語(yǔ)音識(shí)別、語(yǔ)音合成和端到端交互成功率方面都有顯著效果提升。在平臺(tái)系統(tǒng)化布局基礎(chǔ)上,每個(gè)單點(diǎn)性能的提升都能給用戶帶來(lái)極大的交互體驗(yàn)改變。

其一,面向家庭復(fù)雜環(huán)境和人群的識(shí)別優(yōu)化,讓語(yǔ)音交互更簡(jiǎn)單。科大訊飛在語(yǔ)音識(shí)別方面取得關(guān)鍵技術(shù)突破,通過(guò)增強(qiáng)模型和識(shí)別模型的深度耦合,實(shí)現(xiàn)高噪、遠(yuǎn)場(chǎng)混響等各種復(fù)雜環(huán)境下的高精度語(yǔ)音識(shí)別。即使在客廳和廚房這種高噪音復(fù)雜場(chǎng)景下,升級(jí)優(yōu)化的語(yǔ)音識(shí)別可以精準(zhǔn)識(shí)別到家庭用戶的指令詞。同時(shí),iFLYHOME OS 2.0針對(duì)各種方言和口音也能實(shí)現(xiàn)復(fù)雜場(chǎng)景高魯棒性語(yǔ)音識(shí)別,支持7種方言自由切換,滿足家庭多代同堂的“年輕人普通話&老人方言”混合識(shí)別問(wèn)題。

其二,極致擬人的語(yǔ)音合成,讓AI虛擬人交互更有情感。科大訊飛最新一代語(yǔ)音合成技術(shù)在深度學(xué)習(xí)框架的基礎(chǔ)上進(jìn)行了技術(shù)升級(jí),結(jié)合無(wú)監(jiān)督語(yǔ)音聽感屬性解耦和聽感量化編碼技術(shù),實(shí)現(xiàn)對(duì)語(yǔ)音韻律和情感的精細(xì)化建模,從而達(dá)到能夠媲美真人細(xì)膩情感表達(dá)的效果,使得合成語(yǔ)音變得更具有表現(xiàn)力,韻律、音質(zhì)和情感上都要更加貼近真人。目前,iFLYHOME OS 2.0定制化音庫(kù)中有十多種超自然發(fā)音人選擇,家庭用戶可以根據(jù)年齡、性別、場(chǎng)景喜好定制專屬自己的發(fā)言人陪自己對(duì)話聊天。

其三,交互全流程評(píng)價(jià)體系打造,讓端到端體驗(yàn)更完善。針對(duì)平臺(tái)交互評(píng)價(jià)標(biāo)準(zhǔn),科大訊飛聯(lián)合中國(guó)移動(dòng)智慧家庭運(yùn)營(yíng)中心和福建移動(dòng)分公司,在iFLYHOME OS首發(fā)“懂有暢快暖”語(yǔ)音評(píng)價(jià)體系,不同于現(xiàn)有行業(yè)通用的識(shí)別率、語(yǔ)義分析等偏技術(shù)化和分段碎片化的評(píng)價(jià)體系。iFLYHOME OS 2.0聚焦家庭用戶交互全流程,從用戶語(yǔ)音需求出發(fā),注重整體體驗(yàn)感的提升,從單一搜索服務(wù)擴(kuò)充到全場(chǎng)景交互服務(wù),為家庭用戶帶來(lái)更人性化的智能操控體驗(yàn),獲取信息更快、更準(zhǔn)、更智能。將端到端交互成功率提升到90%以上,為行業(yè)平臺(tái)交互應(yīng)用提供標(biāo)準(zhǔn)參考。

- 懂-聽得懂:聚焦語(yǔ)音交互服務(wù),提升“識(shí)別-語(yǔ)義-搜索”全流程交互滿足率,保障用戶基礎(chǔ)體驗(yàn),保障用戶基礎(chǔ)體驗(yàn)。

- 有-服務(wù)多:結(jié)合大屏場(chǎng)景及人群特征,打造100+精品技能。

- 暢-推得準(zhǔn):針對(duì)現(xiàn)網(wǎng)普遍30%+的影片缺失率問(wèn)題,形成“用戶搜索時(shí)給予推薦、搜索后后臺(tái)統(tǒng)計(jì)、資源更新后用戶提醒”的閉環(huán)

- 快-速度快:通過(guò)搜索邏輯與界面展示流程優(yōu)化,全流程響應(yīng)時(shí)間在1S內(nèi)。

- 暖-有情感:通過(guò)交互流暢性、視覺(jué)效果、合成音效果、回復(fù)語(yǔ)人性化程度、用戶引導(dǎo)等功能優(yōu)化。

(以上數(shù)據(jù)來(lái)源:訊飛電視語(yǔ)音平臺(tái)BI數(shù)據(jù))

智慧家庭道路上,科大訊飛始終堅(jiān)持從技術(shù)中來(lái),到產(chǎn)品中去。目前,科大訊飛已成功構(gòu)建一套“AI+家庭”智能化解決方案。相信,基于iFLYHOME OS 2.0的升級(jí)迭代,訊飛將持續(xù)賦能智慧家庭生態(tài),圍繞家庭場(chǎng)景的多樣化需求,技術(shù)連接家庭內(nèi)的智能終端,并通過(guò)開展多元化運(yùn)營(yíng),給家庭用戶帶去多模態(tài)、主動(dòng)式的交互體驗(yàn)。

更溫暖、更精準(zhǔn)、更安全的大屏應(yīng)用創(chuàng)新

iFLYHOME OS 2.0也在場(chǎng)景應(yīng)用方面有所突破創(chuàng)新,家庭用戶體驗(yàn)感提升,大屏語(yǔ)音交互更溫暖、更精準(zhǔn)、更安全。

其一,基于場(chǎng)景的情感型對(duì)話,讓大屏交互更溫暖。相比對(duì)傳統(tǒng)的指令性交互,必須等待用戶主動(dòng)說(shuō)話然后系統(tǒng)進(jìn)行機(jī)械師回復(fù)的方式,家庭用戶對(duì)大屏交互提出更高層次的要求??拼笥嶏w通過(guò)多模態(tài)感知及表達(dá)、主動(dòng)對(duì)話等技術(shù)賦能,在iFLYHOME OS 2.0上升級(jí)AI交互對(duì)話系統(tǒng)能力,系統(tǒng)會(huì)在合適的場(chǎng)景下主動(dòng)進(jìn)行電視助手的關(guān)懷引導(dǎo)和情感化表達(dá),如用戶之前搜索的缺失影片更新上映了,系統(tǒng)會(huì)主動(dòng)進(jìn)行提醒,實(shí)現(xiàn)熱門影片推薦服務(wù)閉環(huán)。

經(jīng)過(guò)多年深耕,iFLYHOME OS 2.0已經(jīng)擁有一整套家庭垂直領(lǐng)域知識(shí)圖譜,覆蓋衣食住行文購(gòu)?qiáng)蕵?lè)等家庭生活全場(chǎng)景。通過(guò)AI對(duì)話系統(tǒng)深度學(xué)習(xí),會(huì)在和用戶對(duì)話的過(guò)程中,結(jié)合用戶的對(duì)話內(nèi)容,進(jìn)行電視內(nèi)容和服務(wù)的推薦,將電視端的內(nèi)容和服務(wù)推薦給家庭用戶使用,從簡(jiǎn)單指令逐漸提升到智能服務(wù)的層次。

其二,面向多人場(chǎng)景的“圖像+聲音”多模態(tài)融合,讓遠(yuǎn)場(chǎng)交互更精準(zhǔn)。現(xiàn)在很多電視、音箱的遠(yuǎn)場(chǎng)交互都是依賴“單語(yǔ)音+喚醒詞”的方式進(jìn)行,一來(lái)這種方式需要用戶頻繁進(jìn)行喚醒詞喚醒,每說(shuō)一句話都要喊一次,非常繁雜;二來(lái)客廳環(huán)境經(jīng)常有各種人聲、電視背景音、甚至窗外的雜音等,會(huì)影響遠(yuǎn)場(chǎng)語(yǔ)音的識(shí)別效果。

iFLYHOME OS 2.0通過(guò)“圖像+聲音”多模態(tài)融合技術(shù),可利用遠(yuǎn)場(chǎng)麥克風(fēng)陣列搭配攝像頭,實(shí)現(xiàn)遠(yuǎn)場(chǎng)聲音定位+攝像頭的人臉和唇形檢測(cè),視覺(jué)+聽覺(jué)雙重信息進(jìn)行說(shuō)話人和內(nèi)容解析,既解決每次說(shuō)話需要喊喚醒詞的繁瑣操作,也做到即使旁邊有其他人說(shuō)話,也能將主說(shuō)話人的干凈人聲從嘈雜背景環(huán)境中分離出來(lái),提升在多人、遠(yuǎn)距離復(fù)雜場(chǎng)景下的語(yǔ)音交互精準(zhǔn)性。有了這種技術(shù),以后即使客廳有再多人,電視也能做到只“聽”你的聲音,隨時(shí)隨地和你實(shí)時(shí)互動(dòng)。

其三,多場(chǎng)景輸入輸出的定向優(yōu)化,大屏輕社交方案更安全。iFLYHOME OS 2.0上線大屏輕交互解決方案,可實(shí)現(xiàn)大屏彈幕和大屏字幕翻譯功能。針對(duì)大屏彈幕功能,上線組合敏感詞識(shí)別、基于語(yǔ)義的敏感內(nèi)容識(shí)別,敏感詞過(guò)濾保障大屏內(nèi)容安全。另外,字幕在線翻譯支持中文和英語(yǔ)等四十多個(gè)語(yǔ)種的互相翻譯,實(shí)施率和準(zhǔn)確率高達(dá)99%,讓大屏視頻觀看實(shí)時(shí)無(wú)障礙。

首款大屏AI虛擬人開啟家庭“元宇宙”

在本次發(fā)布會(huì)上,訊飛智慧家庭還推出了大屏首款情感陪伴AI虛擬人。作為一款兼具情感交互和工具服務(wù)的AI虛擬人,AI虛擬管家可以實(shí)現(xiàn)與家庭用戶在情感陪伴、影視娛樂(lè)、老人健康、兒童成長(zhǎng)、生活服務(wù)、AIoT等多個(gè)場(chǎng)景生態(tài)下的實(shí)時(shí)交互,為用戶提供一站式大屏生活服務(wù)。

AI虛擬管家的多情緒識(shí)別和表達(dá)能力表現(xiàn)出色,能夠根據(jù)家庭用戶的意圖,主動(dòng)推薦內(nèi)容及服務(wù)。從語(yǔ)音交互再到“類人化”交互,AI虛擬管家越來(lái)越接近人與人的對(duì)話習(xí)慣,也更加適合多樣化的現(xiàn)代家庭。

基于iFLYHOME OS 2.0的發(fā)布,科大訊飛依舊秉承著開放共贏的合作理念,面向行業(yè)和合作伙伴提供標(biāo)準(zhǔn)化對(duì)接接口,實(shí)現(xiàn)高效技術(shù)保障。并且面向多種應(yīng)用場(chǎng)景實(shí)現(xiàn)我們的場(chǎng)景開放,向行業(yè)提供多種場(chǎng)景提供帶屏解決方案。

面對(duì)現(xiàn)下元宇宙背景下的“虛擬人”熱潮,科大訊飛誠(chéng)邀產(chǎn)業(yè)合作伙伴共建虛擬人生態(tài),基于訊飛AI虛擬人交互平臺(tái),為客戶提供定制虛擬人解決方案。訊飛希望聯(lián)手運(yùn)營(yíng)商和合作伙伴,通過(guò)iFLYHOME OS 2.0平臺(tái),不斷創(chuàng)造并完善更多的數(shù)字家庭新場(chǎng)景。

作為AI虛擬人技術(shù)及相關(guān)產(chǎn)品和生態(tài)合作的服務(wù)平臺(tái),訊飛AI虛擬人交互平臺(tái)具備多模感知、多維表達(dá)、情感貫穿、自主定制四大關(guān)鍵特點(diǎn)。2022年6月,科大訊飛AI虛擬人交互系統(tǒng)通過(guò)國(guó)內(nèi)首批數(shù)字人系統(tǒng)基礎(chǔ)能力評(píng)測(cè),成功獲得了數(shù)字人領(lǐng)域的權(quán)威標(biāo)準(zhǔn)認(rèn)證,為和產(chǎn)業(yè)鏈合作伙伴合作奠定深厚的技術(shù)基礎(chǔ)。

iFLYHOME OS 2.0的發(fā)布是科大訊飛穩(wěn)步布局智慧家庭生態(tài)布局的重要一步。面對(duì)智慧家庭產(chǎn)業(yè)市場(chǎng)藍(lán)海,科大訊飛將會(huì)繼續(xù)以技術(shù)創(chuàng)新為動(dòng)力進(jìn)行探索,推動(dòng)未來(lái)家庭生活逐步走向智能化。

推薦DIY文章
高顏值黑科技!索尼LinkBuds藍(lán)牙耳機(jī)入手僅699元-全球報(bào)資訊
海新域 | 海星醫(yī)藥健康創(chuàng)新園B區(qū)項(xiàng)目現(xiàn)場(chǎng)拆除施工協(xié)調(diào)會(huì)暨安全生產(chǎn)會(huì)圓滿召開
飛鴿折疊電動(dòng)自行車立減400 僅售898元-全球微頭條
電腦桌面沒(méi)有了怎么恢復(fù)?或許可以嘗試重啟資源管理器-環(huán)球精選
virtualbox怎么安裝系統(tǒng) 如何以virtualbox虛擬機(jī)安裝系統(tǒng)并使用-全球微動(dòng)態(tài)
win7系統(tǒng)找不到word模板路徑怎么辦?有需要用戶可點(diǎn)擊教程參考
精彩新聞

超前放送