Свързани статии data-science

Свързани публикации 'data-science'

Скъсен SVD за намаляване на размерността в матрици с разредени характеристики

Обсъждане на това как съкратеният SVD се различава от нормалния SVD Матриците с редки характеристики изискват специални техники за намаляване на размерността, като разлагане на пресечена единична стойност (Truncated SVD), тъй като повечето от стойностите в матрицата са нула! Разредено представяне на матрица

Практическо прилагане на проста линейна регресия и корелация от нулата

От Мохамед Зейн Амин 1. Въведение В тази публикация ще изследваме линейния регресионен и корелационен модел за изучаване на прогнозно моделиране. Линейната регресия е много прост алгоритъм за машинно обучение за намиране на връзката между две непрекъснати променливи. Една променлива, обозначена като X , се счита за предсказваща или независима променлива. Другата променлива, обозначена като Y, се счита за променлива отговор или зависима . Линейната регресия установява..

K-Nearest Neighbors от нулата

По-лесно е, отколкото си мислите Здравейте читатели! Като завършил студент по бизнес анализи, бях зает с курсова работа, изследвания и задачи. Въпреки това, след кратка пауза, се радвам да се върна към писането за анализи и машинно обучение. В момента вземам курс по „Машинно обучение“, където моят професор ни научи за алгоритъма K-Nearest Neighbors. По време на урока той ни предизвика да кодираме алгоритъма от нулата. Това ми предостави чудесна възможност за нова тема за..

Работа с концепцията за обратна вероятност част 3 (машинно обучение)

Анализ на посредничество, базиран на обратно претегляне на вероятността за данни за микробиоми (arXiv) Автор : Yuexia Zhang , Jian Wang , Jiayi Shen , Jessica Galloway-Pena , Samuel Shelburne , Linbo Wang , Jianhua Hu Резюме: Анализът на медиацията е важен инструмент за изучаване на причинно-следствени връзки в биомедицинските и други научни области и наскоро привлече вниманието в изследванията на микробиомите. Използвайки изследване на микробиома на пациенти с остра миелоидна..

Гама разпределение — Време до r’тото пристигане

В урок 45 Джо и Дивайн се срещат отново, за осми път, за да обсъдят Гама разпределението. Джо обобщава как да изведе функцията за плътност на вероятността за експоненциалното разпределение. Той идентифицира, че това е непрекъснатият аналог на геометричното разпределение. Тъй като е любопитно дете, той задава правилния въпрос. Експоненциалното разпределение също има ли свързано разпределение, което измерва времето за изчакване до „r-тото пристигане“? Дивайн казва, че има..

Сравнение на производителността на многокласови алгоритми за класификация

Тази статия включва прилагането и сравнението на контролирани многокласови алгоритми за класификация към набор от данни, който включва химическия състав (характеристики) и типовете (четири основни типа — цел) на неръждаемите стомани . Наборът от данни е доста малък като брой, но много точен. Наборите от данни за сплав от неръждаема стомана обикновено са ограничени по размер, като по този начин ограничават приложенията на техниките за машинно обучение (ML) за класифициране. Проучих..

Бележник на Jupyter за интерактивни бизнес дискусии - Част 1: Използване на плъзгачи и филтри

Като специалисти по данни, ние често помагаме на бизнеса, като намираме значими прозрения в данните. Това може да включва прогнозиране на ценен бизнес индикатор, така че вземащите решения да могат да вземат определено решение. Е.. това е теорията, но понякога е вярно. Това, което не е вярно, е, че лицата, вземащи решения, приемат нашите базирани на данни препоръки във формата, която се опитваме да представим. Те задават много други въпроси, вероятно за да развият пълно разбиране на нашите..

Нови материали

За да научите нов език за програмиране, започнете отначало

Първоначално публикувано на http://www.mberlove.com/blog/a-new-programming-language-starting-over/ Програмистите се гордеят със способността си да усвояват лесно нови умения , разчитайки..

5 Youtubers на Data Science, които трябва да следвате

Защото всички можем да се справим с малко продуктивно отлагане Всички сме падали в заешката дупка на Youtube, така че защо да не я направим продуктивна?! Като непрекъснато нарастващ източник..

Бих казал, че точно това е проблемът с Twitter — това е инструмент на суперпотребител.

Бих казал, че точно това е проблемът с Twitter — това е инструмент на суперпотребител. По същия начин, по който суперкодерът сочи vim като единствения начин за кодиране, но останалите от нас..

Основи на Gradio

Gradio е най-ефективният метод за демонстриране на вашия модел на машинно обучение и разполага с удобен за потребителя онлайн интерфейс, който го прави достъпен от всяко място. Какво прави..

Илюстрация (GIF) за обяснение на дълбоки конволюционни мрежи (DCNN)

В света на компютърното зрение най-основният и често срещан алгоритъм за разпознаване на изображения е конволюционната мрежа. С популярността на рамки като tensorflow и pytorch, стана по-лесно да..

Python Bootcamp — Data Science Day 165

Python Bootcamp от Giles McMullen-Klein беше абсолютно невероятно. Джайлс има този уникален начин да улови аудиторията си, като същевременно прави съдържанието на курса много интересно...

Сравняване на модели на машинно обучение в R за прогнозиране на смърт поради сърдечна недостатъчност и диабет

Част 1: Използвайте машинно обучение за прогнозиране на смъртно събитие поради сърдечна недостатъчност Целта на този анализ е да се сравнят методите за машинно обучение при прогнозиране на..

Етикети

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Coding Python Deep Learning AI React Java Software Engineering Computer Science Algorithms Typescript Nodejs Data Development Programming Languages Computer Vision Neural Networks Productivity Learning To Code Reactjs Front End Development NLP Tech Angular Tutorial Mathematics ChatGPT Javascript Tips CSS Towards Data Science DevOps Golang Business