讓AI更智能 語(yǔ)音識(shí)別是智能音箱發(fā)展的核心
2017年國(guó)內(nèi)外科技圈爆發(fā)了人工智能熱潮,與此同時(shí)智能音箱作為連接智能家居的入口,已快速成為科技巨頭們紛紛角逐的目標(biāo)。而就國(guó)內(nèi)市場(chǎng)來說,阿里巴巴、騰訊等互聯(lián)網(wǎng)巨頭都已經(jīng)推出屬于自己的智能音箱產(chǎn)品,為開啟智慧家庭打開了大門。不過,話說來回,智能音箱的成功除了“出身”、外觀精美之外,語(yǔ)音識(shí)別技術(shù)才是掌控用戶與設(shè)備交流的大Boss。 就7月發(fā)布的天貓精靈X1而言,這款產(chǎn)品依托于AliGenie操作系統(tǒng),能夠聽懂中文普通話語(yǔ)音指令,可實(shí)現(xiàn)智能家居控制、語(yǔ)音購(gòu)物、手機(jī)充值、叫外賣、音頻音樂播放等功能,帶來人機(jī)交互新體驗(yàn)。而在人工智能的大層面上,其實(shí)自然語(yǔ)言處理也是一個(gè)重要的研究方向?! 谋举|(zhì)上講,自然語(yǔ)言處理,即實(shí)現(xiàn)人機(jī)間自然語(yǔ)言通信,但實(shí)現(xiàn)自然語(yǔ)言理解和自然語(yǔ)言生成是十分困難的,造成困難的根本原因是自然語(yǔ)言文本和對(duì)話的各個(gè)層次上廣泛存在的各種各樣的歧義性或多義性。當(dāng)然,現(xiàn)在智能音箱對(duì)自然語(yǔ)言處理的探索還處于“正在路上”的階段。不過,隨著技術(shù)的不斷發(fā)展,我們有理由相信未來智能音箱能擁有更強(qiáng)的語(yǔ)音識(shí)別技術(shù)。之所以敢這么篤定,是因?yàn)楝F(xiàn)在已有互聯(lián)網(wǎng)巨頭對(duì)自然語(yǔ)言處理進(jìn)行了更深入的挖掘。 阿里巴巴研究了一款名為conv-RNN的通用推理混合框架,用于文本的語(yǔ)義建模,無縫集成了從卷積和循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中提取語(yǔ)言信息的不一樣方面的優(yōu)點(diǎn)從而加強(qiáng)新框架的理解力,可有效甄別用戶的對(duì)話意圖,自主決策對(duì)話中的策略,實(shí)現(xiàn)“自然語(yǔ)言無縫理解,跨領(lǐng)域自由切換”。 業(yè)內(nèi)人士表示,阿里在語(yǔ)音交互、語(yǔ)義理解方面動(dòng)作頻頻,不排除進(jìn)入消費(fèi)級(jí)產(chǎn)品領(lǐng)域,如車載語(yǔ)音助手、智能音響等,與亞馬遜、蘋果等科技公司展開正面競(jìng)爭(zhēng)。以現(xiàn)在情形來看,阿里已經(jīng)在智能音箱產(chǎn)品上發(fā)力,未來阿里人工智能實(shí)驗(yàn)室下的天貓精靈系列產(chǎn)品有望擁有更強(qiáng)大的語(yǔ)音識(shí)別能力,AI更懂你將不再是難題。