微軟 AI 技術(shù)新進(jìn)展,可以基于圖片內(nèi)容回答自然語言問題
時(shí)間:2015-11-27 09:27:53 來源:36氪 作者:
智播報(bào)
最近,據(jù) ZDNet,微軟在卡耐基梅隆大學(xué)的一個(gè)研究小組開發(fā)出一個(gè)新的 AI 系統(tǒng),這個(gè)系統(tǒng)可以訓(xùn)練機(jī)器識(shí)別圖像的內(nèi)容,并回答自然語言提出的問題。例如,現(xiàn)在有一張狗坐在自行車籃子里的照片,這項(xiàng)技術(shù)用來回答,“什么坐在自行車的籃子里” 這樣的問題。
微軟的研究人員表示,回答這樣一個(gè)問題并不簡單,需要多步驟推理,具體解決方案是 “堆棧注意力網(wǎng)絡(luò)(Stack Attention Networks)”,圖片經(jīng)過多層深度神經(jīng)網(wǎng)絡(luò)進(jìn)行 “注意力” 分析,計(jì)算出哪些區(qū)域與問題有關(guān)。單層 “注意力” 分析技術(shù)曾用于圖像自動(dòng)字幕和機(jī)器翻譯。具體技術(shù)原理參加他們的論文。
這項(xiàng)技術(shù)未來可以用于實(shí)時(shí)識(shí)別并預(yù)測(cè)人的需求,例如,自行車頭盔上的攝像頭預(yù)警系統(tǒng),這個(gè)系統(tǒng)會(huì)不停地問自己問題,諸如 “我的左邊是什么?”,“旁邊是不是有車要超我?”,“有沒有跑向我但我沒注意到的人?”,這些問題的答案可以用來提示騎車人,預(yù)防危險(xiǎn)的發(fā)生。
前些天,Google 的自然語言處理剛剛?cè)〉猛黄?,可以通過文字或語音識(shí)別出 “最高級(jí)”、“基于時(shí)間的” 查詢和一些復(fù)雜組合問題。
智能界(moderndentistryformadison.com)中國智能科技聚合推薦平臺(tái),秉承“引領(lǐng)未來智能生活”的理念,專注報(bào)道智能家居、可穿戴設(shè)備、智能醫(yī)療、機(jī)器人、3D打印、智能汽車等諸多科技前沿領(lǐng)域。關(guān)注智能創(chuàng)新對(duì)人的生活方式、價(jià)值的改變,致力傳播放大這部分聲量。聚合品牌宣傳、代理招商、產(chǎn)品評(píng)測(cè)、原創(chuàng)視頻、fm電臺(tái)與試用眾測(cè),深入智能硬件行業(yè),全平臺(tái)多維度為用戶及廠商提供服務(wù),致力成為中國最具影響力的智能硬件聚合推薦平臺(tái)。
最新評(píng)論