微軟 AI 技術(shù)新進(jìn)展，可以基于圖片內(nèi)容回答自然語言問題

時(shí)間：2015-11-27 09:27:53 來源：36氪作者：智播報(bào)

最近，據(jù) ZDNet，微軟在卡耐基梅隆大學(xué)的一個(gè)研究小組開發(fā)出一個(gè)新的 AI 系統(tǒng)，這個(gè)系統(tǒng)可以訓(xùn)練機(jī)器識(shí)別圖像的內(nèi)容，并回答自然語言提出的問題。例如，現(xiàn)在有一張狗坐在自行車籃子里的照片，這項(xiàng)技術(shù)用來回答，“什么坐在自行車的籃子里” 這樣的問題。

微軟的研究人員表示，回答這樣一個(gè)問題并不簡單，需要多步驟推理，具體解決方案是 “堆棧注意力網(wǎng)絡(luò)（Stack Attention Networks）”，圖片經(jīng)過多層深度神經(jīng)網(wǎng)絡(luò)進(jìn)行 “注意力” 分析，計(jì)算出哪些區(qū)域與問題有關(guān)。單層 “注意力” 分析技術(shù)曾用于圖像自動(dòng)字幕和機(jī)器翻譯。具體技術(shù)原理參加他們的論文。

這項(xiàng)技術(shù)未來可以用于實(shí)時(shí)識(shí)別并預(yù)測(cè)人的需求，例如，自行車頭盔上的攝像頭預(yù)警系統(tǒng)，這個(gè)系統(tǒng)會(huì)不停地問自己問題，諸如 “我的左邊是什么?”，“旁邊是不是有車要超我？”，“有沒有跑向我但我沒注意到的人？”，這些問題的答案可以用來提示騎車人，預(yù)防危險(xiǎn)的發(fā)生。

前些天，Google 的自然語言處理剛剛?cè)〉猛黄?，可以通過文字或語音識(shí)別出 “最高級(jí)”、“基于時(shí)間的” 查詢和一些復(fù)雜組合問題。

智能界（moderndentistryformadison.com）中國智能科技聚合推薦平臺(tái)，秉承“引領(lǐng)未來智能生活”的理念，專注報(bào)道智能家居、可穿戴設(shè)備、智能醫(yī)療、機(jī)器人、3D打印、智能汽車等諸多科技前沿領(lǐng)域。關(guān)注智能創(chuàng)新對(duì)人的生活方式、價(jià)值的改變，致力傳播放大這部分聲量。聚合品牌宣傳、代理招商、產(chǎn)品評(píng)測(cè)、原創(chuàng)視頻、fm電臺(tái)與試用眾測(cè)，深入智能硬件行業(yè)，全平臺(tái)多維度為用戶及廠商提供服務(wù)，致力成為中國最具影響力的智能硬件聚合推薦平臺(tái)。

微軟 AI 系統(tǒng) 識(shí)別圖像

人收藏

人贊過

相關(guān)文章

關(guān)鍵字：微軟 AI 系統(tǒng) 識(shí)別圖像