麻省理工卷積神經(jīng)網(wǎng)絡:能恢復模糊圖像中的清晰信息
據(jù)外媒報道,麻省理工學院(MIT)的科學家們找到了一種可以在運動模糊的視頻幀中恢復細節(jié)并重現(xiàn)清晰圖像的方法。這套“視覺投影模型”通過使用卷積神經(jīng)網(wǎng)絡(CNN)來解碼圖像。 MIT計算機科學和人工智能實驗室(CSAIL)的研究人員通過掃描數(shù)千對圖像(投影)訓練CNN,其中一幅圖像質(zhì)量較低,另一幅圖像則圖像模糊。神經(jīng)網(wǎng)絡利用這些信息然后通過學習像素模式和像素來源從本質(zhì)上逆轉(zhuǎn)模糊效果。 CNN的另一部分責備稱為“變分自動編碼器(variational autocoder)”,它能夠分析輸出并評估網(wǎng)絡跟信號的匹配程度。隨后,它則會創(chuàng)建一幅“藍圖”告訴AI如何對一個投影到所有可能的匹配源進行處理。當給定一幅新圖像時,CNN會檢查像素模式并使用該藍圖尋找可能導致模糊的每個信號,然后它組合數(shù)據(jù)創(chuàng)建一個“高維”副本。 打個比方,在一段顯示一輛汽車飛馳而過的視頻中你可能能分辨出那輛車是紅色的,但除此之外其他的信息則都不清楚。而視覺投影模型可以獲取這些素材并創(chuàng)建一個足夠清晰的復制品來識別制作和模型。 |