Приложения на Neural Retrieval part1 (машинно обучение)

Изследване на статично подрязване на редки невронни ретривъри (arXiv)

Автор: Карлос Ласанс, Симон Лупарт, Ерве Дежан, Стефан Клинчан, Никола Тонелото

Резюме: Разредените невронни ретривъри, като DeepImpact, uniCOIL и SPLADE, бяха въведени наскоро като ефикасен и ефективен начин за извършване на извличане с обърнати индекси. Те имат за цел да научат важността на термина и в някои случаи разширяването на документа, за да осигурят по-ефективно класиране на документи в сравнение с традиционните модели за извличане на думи като BM25. Въпреки това е доказано, че тези редки невронни ретривъри увеличават изчислителните разходи и латентността на обработката на заявки в сравнение с техните класически аналози. За да смекчим това, ние прилагаме добре познато семейство от техники за повишаване на ефективността на обработката на заявки върху обърнати индекси: статично съкращаване. Ние експериментираме с три статични стратегии за съкращаване, а именно съкращаване, ориентирано към документи, ориентирано към термини и агностично съкращаване, и оценяваме, върху различни набори от данни, че тези техники все още работят с редки невронни ретривъри. По-специално, статичното подрязване постига 2x ускоряване с незначителна загуба на ефективност (≤2% спад) и, в зависимост от случая на употреба, дори 4x ускоряване с минимално въздействие върху ефективността (≤8% спад). Освен това, ние показваме, че невронните прекласатори са стабилни за кандидати от статично съкратени индекси

2. Може ли замразен предварително обучен езиков модел да се използва за нулево невронно извличане на въпроси, ориентирани към обекта? (arXiv)

Автор : Yasuto Hoshi, Daisuke Miyashita, Yasuhiro Morioka, Youyang Ng, Osamu Torii, Jun Deguchi

Резюме: Невронните ретривъри за документи, включително извличане на плътни пасажи (DPR), превъзхождат класическите ретривъри за лексикално съвпадение, като BM25, когато са фино настроени и тествани върху специфични набори от данни, отговарящи на въпроси. Въпреки това беше показано, че съществуващите плътни ретривъри не обобщават добре не само извън домейн, но дори и в домейн като Wikipedia, особено когато наименуван обект във въпрос е доминираща следа за извличане. В тази статия ние предлагаме подход към обобщаване в домейна, използвайки вгражданията, генерирани от замразения езиков модел, обучен с обектите в домейна. Като не прецизираме, ние изследваме възможността богатите знания, съдържащи се в предварително обучен езиков модел, да могат да се използват за задачи за извличане. Предложеният метод превъзхожда конвенционалните DPR на въпроси, ориентирани към обекти в домейна на Wikipedia, и постига почти сравнима производителност с BM25 и най-съвременния SPAR модел. Ние също така показваме, че контекстуализираните ключове водят до силни подобрения в сравнение с BM25, когато имената на обектите се състоят от общи думи. Нашите резултати демонстрират осъществимостта на метода за извличане с нулев изстрел за въпроси, ориентирани към обекти на домейн на Wikipedia, където DPR има затруднения да се представи.

Вижте също:

Нови материали

Създайте разширение за Chrome с помощта на Angular

Този урок е базиран на манифеста на разширението на chrome версия 3 (MV3), а също и на Angular версия 2+ (2, 3 и...). Ако не сте използвали манифест версия 3, можете да следвате този урок ,..

За да научите нов език за програмиране, започнете отначало

Първоначално публикувано на http://www.mberlove.com/blog/a-new-programming-language-starting-over/ Програмистите се гордеят със способността си да усвояват лесно нови умения , разчитайки..

5 Youtubers на Data Science, които трябва да следвате

Защото всички можем да се справим с малко продуктивно отлагане Всички сме падали в заешката дупка на Youtube, така че защо да не я направим продуктивна?! Като непрекъснато нарастващ източник..

Бих казал, че точно това е проблемът с Twitter — това е инструмент на суперпотребител.

Бих казал, че точно това е проблемът с Twitter — това е инструмент на суперпотребител. По същия начин, по който суперкодерът сочи vim като единствения начин за кодиране, но останалите от нас..

Основи на Gradio

Gradio е най-ефективният метод за демонстриране на вашия модел на машинно обучение и разполага с удобен за потребителя онлайн интерфейс, който го прави достъпен от всяко място. Какво прави..

Илюстрация (GIF) за обяснение на дълбоки конволюционни мрежи (DCNN)

В света на компютърното зрение най-основният и често срещан алгоритъм за разпознаване на изображения е конволюционната мрежа. С популярността на рамки като tensorflow и pytorch, стана по-лесно да..

Python Bootcamp — Data Science Day 165

Python Bootcamp от Giles McMullen-Klein беше абсолютно невероятно. Джайлс има този уникален начин да улови аудиторията си, като същевременно прави съдържанието на курса много интересно...

Етикети

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Coding Web Development Python Deep Learning AI React Java Software Engineering Computer Science Algorithms Typescript Nodejs Data Programming Languages Development Productivity Learning To Code Computer Vision Neural Networks Reactjs Front End Development NLP Tech Angular Javascript Tips CSS Tutorial Mathematics ChatGPT Statistics API Big Data Towards Data Science