沈陽(yáng)自動(dòng)化所“機(jī)器人行為智能”研究取得進(jìn)展
中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所研究人員近期提出了一種可提升機(jī)器人行為智能的新方法,相關(guān)成果發(fā)表于IEEE Transactions on Cognitive and Developmental Systems。 人類在日常生活中處理復(fù)雜任務(wù)時(shí)表現(xiàn)出驚人的適應(yīng)性,這種適應(yīng)性是個(gè)體學(xué)習(xí)能力的直接體現(xiàn),使人類可以自主、增量地提升自身的行為能力。研究人員以 Q 學(xué)習(xí)與自適應(yīng)核線性(Adaptive Kernel Linear,AKL)模型等網(wǎng)絡(luò)化模型為基礎(chǔ),構(gòu)建了機(jī)器人增量式學(xué)習(xí)方法的新框架,賦予機(jī)器人根據(jù)數(shù)據(jù)與案例的實(shí)時(shí)獲取自發(fā)產(chǎn)生新的行為模式,以提升機(jī)器人的行為智能能力。新的算法可通過(guò)自主、示教等不同方式,使機(jī)器人對(duì)自我行為進(jìn)行評(píng)估,并實(shí)時(shí)改變自身行為產(chǎn)生的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),實(shí)現(xiàn)行為知識(shí)的在線學(xué)習(xí)和增量學(xué)習(xí)。 該成果目前已應(yīng)用在機(jī)器人自主導(dǎo)航中,并且通過(guò)大量的仿真和試驗(yàn)使機(jī)器人可以以一個(gè)空網(wǎng)絡(luò)為起點(diǎn),增量式學(xué)習(xí)并形成新的行為以適應(yīng)新的場(chǎng)景,同時(shí)不會(huì)遺忘之前所學(xué)習(xí)的行為。 |