A.I. Hero е на мисия да демократизира AI —Ние силно вярваме, че хората имат невероятен потенциал да променят света с идеите си и всеки трябва да може да използва AI, за да реализира тези идеи в мащаб. Ето защо ние се фокусираме върху овластяването на експерти в областта (известни още като експерти по предмет) с инструменти и услуги за автоматизиране на задачите им, генериране на прозрения и въздействие върху техните крайни потребители.

AI Hero поставя експерти в домейна в контрола върху изграждането на AI

Задачата, която AI ще замени, или в момента се изпълнява от експерт, или се основава на това, което те биха направили рутинно. В традиционните AI проекти експертите по домейни действат като „съветници“ относно производителността на модела или самите пояснения към данните, докато специалистите по данни контролират модела и процеса. В резултат на това повечето AI решения от край до край са предназначени за специалисти по данни или анализатори на данни.

От нашия опит в успешното изпълнение на клиентски проекти, разнообразието от случаи на употреба, върху които сме работили, и онлайн литература, ние вярваме, че наличието на експерт по домейн, който да контролира, докато изгражда AI, е безценно. Ето някои от причините:

  • Експертите по домейни познават проблемите по-добре от всеки друг и разбират критичните болкови точки, от които се нуждаят автоматизирани (което може да не е най-очевидното място за ML модел, който Data Scientist би изградил).
  • Експертите в областта също знаят как в момента решават тези проблеми, крайните случаи и нюансите в разсъжденията. В резултат на това идеалното решение трябва да бъде предписано от експертите, а не напълно разкрито от данните. Най-добре е сместа.
  • Експертите по домейни знаят какво се случва с данните, източника, доверието и ограниченията за използване. Например контекстът или историята, които може да не бъдат първоначално уловени в данните.
  • Експертите по домейни нямат време да създават перфектни за пиксели анотации и дори да извършват оценки. И така обратната връзка е много важна, но и ограничена във времето. UX на инструментите трябва да бъде приоритет за тях.
  • В традиционен екип за наука за данни, където различни заинтересовани страни и експерти участват в проекта, повторението може да бъде по-бавно с бавни комуникационни цикли (напр. отнемащи няколко дни до дори седмици). Наличието на единна платформа от край до край с екипен достъп може да помогне за ускоряване на бързата итерация и актуализации.

AI, ориентиран към данни: Обучаващи машини с правилната учебна програма

AI Hero използва ориентиран към данните подход за изграждане на AI. Създаден от Андрю Нг в Landing AI, подходът, ориентиран към данните, се фокусира върху гарантирането, че данните, използвани за обучение на модели, са с високо качество и етикетирани последователно. От друга страна, подходът, ориентиран към модела, се фокусира върху подобренията на модела чрез използване на различни алгоритми, настройка на хиперпараметри и т.н. AI Hero насърчава възприемането на нова перспектива за начина, по който обучаваме машини — обхващащ разбиране какво означават „правилните“ данни, как ги извличаме, как се улавят знанията за домейна, как преодоляваме пристрастията и как гарантираме, че изграждаме правилната AI функция, продукт, инструмент или табло за управление. Това е в контраст с традиционния фокус само върху машинното „обучение“.

Дефиниране — Експертът по домейна първо дефинира автоматизацията и й съобщава за типа на модела, който трябва да бъде изграден, онтологията и т.н. След това, когато потребителят качва данните, той се опитва да ги разбере и приоритизира данните за формиране на примери за обучение, които след това се представят на експерта по домейна. Това обикновено са част от данните, които могат да бъдат прегледани от експерта на едно заседание.

Обучение — След това експертът по домейна обучава AI Hero на задачата за автоматизация с примери. Инструментите за анотиране на данни, проектирани специално за експерта по домейн, помагат да се извлекат знанията на експерта по домейн относно задачата за автоматизация. След като са налични достатъчно примери, AI Hero автоматично обучава най-съвременните моделни алгоритми, започвайки от предварително обучени контролни точки, върху тези примери. След това моли експерта да прегледа наученото.

Използване — След преглед, ако експертът е доволен от представянето на AI Hero за автоматизиране на задачата, той може да започне да го използва веднага. Те могат или да изтеглят прогнози, или да интегрират модела със своя софтуер, използвайки API. Данните, с които моделът се използва за прогнозиране, се връщат обратно в системата на етапа на дефиниране. Ако експертът не е доволен от представянето на модела, AI Hero иска от експерта още примери за обучение и се връща към етапа на влака.

Тези три етапа са итеративни и също така помагат за подобряване на производителността на модела и се използват за надграждане на модела, ако домейнът се промени, ако се появят нови случаи на употреба или ако онтологията или задачата за автоматизация се променят на практика.

Как работи

С AI Hero създавате автоматизации. Тези автоматизации могат да използват един или повече ML модели зад кулисите, в допълнение към база данни за търсене, евристика и т.н. Ние правим тази практическа абстракция, защото повечето случаи на употреба имат код за предварителна и последваща обработка, критерии за филтриране, евристика, преглед на данни -up и т.н. в допълнение към самия ML модел. Автоматизациите ни казват също какво е резултатът от AI Hero — да автоматизираме някои задачи за експерта по домейна.

Можете да изберете да създадете автоматизация от някой от нашите шаблони за автоматизация. Всеки шаблон зад кулисите също така включва конвейер за ML Ops от край до край, който ви позволява да обучавате AI в трите стъпки, описани по-горе. Списъкът ни с решения непрекъснато нараства и може лесно да бъде разширен до конкретни случаи на употреба в резултат на нашата модулна архитектура (описана по-късно). В този раздел ще използваме примера за автоматизация „Тагиране на кратък текст“, която помага на потребителите да категоризират текст. Нашият случай на използване ще бъде този за откриване на бедствие в туитове - от което например местна правителствена агенция може да се интересува.

След като създаде модела, експертът качва данните като CSV файл. CSV файлът ще съдържа както положителни, така и отрицателни примери за обучение на AI.

След това експертът може да уточни онтологията и да каже на AI Hero за задачата за автоматизация. В този случай тя уточнява, че искаме да категоризираме туитовете като „Бедствие“ или не. Тъй като AI Hero знае повече за онтологията, той също се опитва да разбере данните и да създаде примери за обучение за експерта.

След това експертът може да научи AI Hero с примерите. Тук се случва магията. Дори преди експертът да е предоставил примери, AI Hero може да използва знания от други задачи, за които е бил предварително обучен (публични набори от данни), за да предвиди дали туитовете са за бедствие или не. Това е благодарение на най-съвременна техника, наречена обучение с нулев и няколко изстрела. След това експертът предоставя обратна връзка, за да каже на AI Hero дали прогнозата е правилна или не (палец нагоре/надолу). Тя може например да даде палец нагоре за първите два примера по-долу и да коригира прогнозата с палец надолу за третия пример по-долу.

Забележка: Въпреки че AI Hero използва най-съвременни методи и предварително обучени модели за начало, първоначалните прогнози може да са изключително неточни. Като правило, AI Hero може да се подобри с течение на времето с повече примери, така че при множество итерации количеството примери, които експертът трябва да коригира, намалява, а точността се увеличава.

И накрая, когато експертът е доволен от ефективността на автоматизацията, той може да изтегли прогнозите за останалите данни или да започне да интегрира модела с други табла за управление и т.н., използвайки нашите API.

Някои предишни успехи

За да демонстрираме успеха на AI Hero към демократизирането на AI, ето няколко истории за успех, при които експерт, който няма познания по Data Science, е успял да научи AI Hero с примери и да получи обучение за автоматизация.

  • Откриване на форми на розетки при леопарди: Стажант от най-добрия университет в Силиконовата долина, който беше младши в местна гимназия, успя да създаде автоматизация за откриване на броя и формите на розетките при леопарди. Тя тренира на около 20 примера, а AI hero автоматизира останалите 67.
  • Научаване как AI може да се използва в хематологията: Студент по медицина от Индия успя да разбере нюансите и проблемите при използването на AI за медицината. В нейния случай тя успя да открие маларийни паразити в натривки от периферна кръв и да разбере как осветлението, примесите в набора от данни, грешките в поясненията и т.н. влияят върху точността.
  • Препоръчване на връзки към купувачи и продавачи на пазар: Технически директор без код на компания успя да обучи модел за препоръки, който успя да направи връзки между купувачи и продавачи в тяхното приложение въз основа на критериите за търсене и данните. Това автоматизира техните ежедневни задачи за препоръки, които отнемаха около 3 часа дневно, и също така помогна за увеличаване на ангажираността на платформата.

Във всички тези примери експертите бяха експерти по даден предмет, които разбираха домейна и знаеха какви модели биха искали да създадат, но не можеха да използват никакви налични инструменти, тъй като нямаха опит в науката за данните.

Архитектурата: Технически подробности

Под капака, AI Hero е ML Ops платформа, която е изключително адаптивна за създаване на златен стандарт ML тръбопроводи за различни случаи на употреба. Нашата модулна архитектура ни позволява бързо да изграждаме и внедряваме тръбопроводи от край до край, включително инструменти за експерти по домейни, почистване на данни, анотация на данни, обучение на модели и внедряване за конкретни случаи на употреба. Например, докато моделите и усилията на машинното обучение са сходни за генерични тръбопроводи „Категоризация на текст“ и „Анализ на настроението“, потребителските интерфейси за експертната анотация, кодът за обучение на модела и кодът за внедряване на модела са различни и модулирани за оптимално производителност за техните индивидуални жизнени цикли на ML Ops. Тази възможност за разширение също ни позволява да бъдем гъвкави и бързо да генерираме нов (или дори персонализиран) тръбопровод за допълнителен ML тръбопровод, който да бъде добавен към платформата.

Отличителни характеристики на нашата архитектура са:

а. Платформата е Cloud Native— Всяка микроуслуга е контейнеризирана и може да се използва като SaaS услуга, хоствана от AI Hero, или да бъде внедрена в частен облак (напр. правителствен или клиентски облак), on-prem (напр. частна сървърна стая ), или на сървъри с въздушна междина (напр. защитени държавни съоръжения). Това дизайнерско решение прави платформата облачно агностична и може да работи на почти всеки модерен публичен облак, който поддържа контейнеризация (напр. AWS, Azure, GCP и т.н.) или дори локални клъстери (напр. използване на Kubernetes и т.н.).

б. Сигурността е вградена— Всички обаждания от уеб приложението към сървъра са защитени и използват система с два ключа: Един за достъп до платформата и след това друг за достъп до автоматизацията (мислете за това като ключ за сграда и след това за стаите). Всяка автоматизация може да има екип от потребители, на които собственикът на автоматизацията може да присвои различни роли (напр. участник, зрител, анотатор и т.н.). Достъпът до различни части на платформата е ограничен до тези роли в зависимост от техните нужди. Докато влизането и удостоверяването са или без парола (за хора) или с API ключ (за софтуерни интеграции), може да се конфигурира двуфакторно удостоверяване.

в. Съхранението на данни е оптимизирано от гледна точка на разходите — Съхраняваме повечето данни, необходими за автоматизацията, в базата данни, но тя е допълнена със съвместимо със S3 обектно съхранение за големи файлове, видеоклипове, сложни данни и т.н. Благодарение на гъвкавостта, необходима при заснемането различните случаи на използване на тръбопроводите и различните етапи от жизнените цикли на ML Ops AI Hero се нуждае от база данни MongoDB NoSQL като хранилище на данни и съвместима с S3 кофа (напр. AWS S3, Minio и др.). Експертът може да качва данни в платформата или може също да посочи източник на данни, от който AI Hero да импортира данни. Осигуряването на източника на данни (напр. API ключ и т.н. се съхранява в защитената база данни за удостоверяване)

г. Обучението на модела е автоматизирано — Нашата опашка за обработка на събития слуша събития от потребителския интерфейс, докато експертът по домейна обучава AI Hero. В зависимост от вида на събитието модулът за обработка или поглъща, разбира, научава, опитва, визуализира или експортира данните. След като има достатъчно нови данни за обучение, AI Hero се учи автоматично и съхранява актуализирания модел в S3 съвместимо хранилище на обекти. AI Hero използва най-съвременни моделни алгоритми, започвайки от предварително обучени контролни точки, върху тези примери въз основа на размера и типа на данните.

д. Внедряването на модела е автоматизирано— Вместо да поддържа и управлява различни версии на модела, AI Hero използва парадигма „Шампион срещу претендент“ за внедрените модели – моделът, който се представя най-добре на данните за задържане, е шампион и разгърнат в производство за употреба. Когато се обучава нов модел, ние се отнасяме към него като към претендент — ако се представи по-добре от шампионския модел на данните за задържане, той става новият шампион. Внедреният модел може да се използва асинхронно (за пакетно прогнозиране или когато потребителският интерфейс не чака прогнозиране в реално време) или синхронно (когато потребителското изживяване чака незабавно прогнозиране).

Тъй като микроуслугите са контейнеризирани, те могат да бъдат разгърнати с помощта на стандартни CI/CD тръбопроводи с промоция на изображение в различни среди (напр. пясъчна среда, сценична среда, производство) и могат да бъдат осигурени сигурно с помощта на променливи на средата, които могат да бъдат предоставени на услугите. Микроуслугите могат да бъдат разгърнати на оптимизирани за изчисления или памет оптимизирани екземпляри или дори ускорени процесори за задачи на Deep Learning (напр. GPU/TPU).

За компанията

ИИ Hero, Inc. е стартираща компания в ранен етап, базирана в Сан Франциско, Калифорния.

Платформата е достъпна на адрес https://api.aihero.studio и може да се използва с различни нива: начинаещи (самообслужване), професионалисти и предприятия в зависимост от сложността на задачата и етапа на прототипа до Минимален жизнеспособен продукт в производство. Ценообразуването варира според изискванията за автоматизация, размера на данните и използваните допълнителни услуги.

Нашият основен екип се състои от нашия основател — Рахул Парундекар и експертни съветници с демонстриран опит в пускането на ML в производство за различни случаи на употреба.

Относно Рахул Парундекар: https://linkedin.com/in/rparundekar

Рахул е запален по изграждането на решения за изкуствен интелект за подобряване на човешкия опит. Той има над 13 години опит в изграждането на AI и преди да работи на пълен работен ден върху AI Hero, е бил директор на Data Science в публично регистрирана компания за анотации на данни. Обслужващата архитектура на ML модела, която неговият екип изгради в един момент, обслужва до 36 модела в производство с натоварване от около 1 милион прогнози на ден.