Напредък в областта на дестилацията на знания, част 2 (изкуствен интелект)

Постепенно обучение за поле на невронно излъчване с филтрирана по несигурност дестилация на знания(arXiv)

Автор:Mengqi Guo, Chen Li, Gim Hee Lee

Резюме:Съвременното представяне на полето на неврално излъчване (NeRF) постигна голям успех в задачите за синтез на нов изглед и 3D реконструкция. Те обаче страдат от катастрофалния проблем със забравянето, когато непрекъснато се учат от поточни данни, без да преразглеждат предишните данни за обучение. Това ограничение забранява прилагането на съществуващи NeRF модели към сценарии, при които изображенията идват последователно. С оглед на това, ние изследваме задачата за постепенно обучение за представяне на полето на невронно излъчване в тази работа. Първо предлагаме тръбопровод ученик-учител, за да смекчим катастрофалния проблем със забравянето. По-конкретно, повтаряме процеса на използване на ученика като учител в края на всяка постепенна стъпка и оставяме учителя да ръководи обучението на ученика в следващата стъпка. По този начин мрежата на учениците може да научава нова информация от поточно предаваните данни и едновременно да запазва стари знания от мрежата на учителите. Като се има предвид, че не цялата информация от мрежата на учителите е полезна, тъй като тя се обучава само със старите данни, ние допълнително въвеждаме произволен питащ и филтър, базиран на несигурност, за филтриране на полезна информация. Провеждаме експерименти върху наборите от данни NeRF-synthetic360 и NeRF-real360, където нашият подход значително превъзхожда базовите линии със 7,3% и 25,2% по отношение на PSNR. Освен това, ние също така показваме, че нашият подход може да бъде приложен към набора от данни ScanNet с широкомащабна камера, обърната навън, където надминаваме базовата линия с 60,0% в PSNR.

2.НОЖ: Дестилация на знания с обосновки в свободен текст(arXiv)

Автор: Aaron Chan, Zhiyuan Zeng, Wyatt Lake, Brihi Joshi, Hanjie Chen, Xiang Ren

Резюме:Обосновките със свободен текст (FTR) проследяват как хората общуват, като обясняват процесите на разсъждение чрез естествен език. Редица скорошни разработки проучват как да се подобри обобщаването на езиковия модел (LM) чрез използване на FTR, за да се обучат LM на правилните процеси на разсъждение зад правилните резултати от задачите. Тези предишни разработки имат за цел да се учат от FTR, като ги добавят към входа на LM или целевия изход, но това може да доведе до промяна на разпределението на входа или съответно в конфликт с целта на задачата. Ние предлагаме KNIFE, който дестилира FTR знания от FTR-разширен учител LM (взема както въвеждане на задачи, така и FTR) към ученик LM (взема само въвеждане на задачи), което се използва за извод. Най-важното е, че предните изчисления на учителя LM имат етап на затруднение, в който всички негови FTR състояния са маскирани, което изтласква знания от FTR състоянията към входно/изходните състояния на задачата. След това знанията за FTR се дестилират към LM на ученика чрез обучение на неговите входни/изходни състояния на задачите, за да се приведат в съответствие с LM на учителя. На два набора от данни, отговарящи на въпроси, ние показваме, че KNIFE значително превъзхожда съществуващите FTR методи за обучение, както в напълно контролирани, така и в настройки с ниски ресурси.

Вижте също:

Нови материали

PHP — P51: Модификатори на видимост

Изглежда, че съм споменавал модификатори на видимост в повечето от предишните статии; най-накрая е време да се захванем с тях. Ще продължим оттам, където спряхме с нашите класове в предишната..

Създаване на лента за прогрес на четене в React

Лентите за напредъка на четенето, като този, който можете да намерите в моя блог в горната част на единични публикации, са хубаво малко допълнение за предоставяне на подробна информация за това..

Обучение с подсилване

Обучение с подсилване https://www.ml-concepts.com/machine-learning-models/ Обучението с подсилване е област на машинното обучение. Става дума за предприемане на подходящи действия за..

От гледна точка на студентите

Стартиране на училище и програмата за отложено плащане Прекарахме последните няколко месеца в усъвършенстване на „Програмата за отложено плащане“ (DPP) и се радваме, че достигаме до толкова..

Интерактивни резултати с jupyter тетрадки

От тази статия ще разберете как да създавате интерактивни резултати за вашите решения за машинно обучение на преносим компютър jupyter с помощта на ipywidgets. Тази статия първоначално е..

Създаване на просто приложение с последователни изтегляния

Преди малко повече от година пуснах просто приложение. Току-що бях научил как да използвам Flutter, кросплатформена рамка за разработка на приложения, и исках да пусна първото си приложение,..

Гледайте и научете как да модулирате своя монолит

В началото на юни приключихме втората си сесия на Discord Live. И трябва да съобщим, че беше успешен. Тъй като продължаваме да показваме на света колко полезни са микро интерфейсите, решихме..

Етикети

Machine Learning JavaScript Data Science Artificial Intelligence Web Development Software Development Coding Python Deep Learning React AI Java Software Engineering Computer Science Nodejs Algorithms Typescript Development Programming Languages Productivity Computer Vision Data Learning To Code Front End Development Tutorial Reactjs Javascript Tips NLP ChatGPT Angular Neural Networks Mathematics Statistics Business Golang Tech CSS Towards Data Science