Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.37K photos
119 videos
64 files
4.81K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Как извлечь отдельные значения из столбца в SQL?

Используя ключевое слово DISTINCT в сочетании с командой SELECT, мы можем извлекать различные значения из столбца в SQL. Ключевое слово DISTINCT используется для фильтрации дубликатов значений и возврата только уникальных значений из указанного столбца.
#вопросы_с_собеседований
👍5🥱5👏1
Что такое диффузионные модели?

Диффузионные модели используются для генерации новых данных (например, изображений), и в их основе лежит процесс «зашумления» и «расшумления».

✍️ Как это работает?

▪️К исходному объекту добавляется случайный шум. На каждом этапе этого процесса объект становится всё более «шумным», пока не превратится в почти случайный набор данных.
▪️Теперь задача модели — шаг за шагом «убирать» шум, чтобы восстановить что-то осмысленное, например, изображение.

Этот процесс моделируется с использованием вероятностных методов, а сами шаги зашумления и расшумления подбираются так, чтобы результат выглядел реалистично.

#вопросы_с_собеседований
😁3🥱1
✍️ Как определить выбросы с помощью критерия Граббса?

Главное предположение критерия Граббса состоит в том, что выборка имеет нормальное распределение.

🔧 Алгоритм определения выбросов:

1️⃣ Возьмите данные и найдите самое удалённое значение.

2️⃣ Рассчитайте метрику отклонения.
Для этого нужно определить, насколько далеко это значение находится от среднего уровня остальных данных, учитывая их вариативность.

3️⃣ Сравните с критическим значением.
Критическое значение берётся из таблицы критерия Граббса (оно зависит от количества данных и уровня значимости). Если метрика превышает этот порог, значение считается выбросом.

#вопросы_с_собеседований
👍7