Алгоритм MissForest отлично восстанавливает пропущенные данные, но в предиктивных моделях он даёт сбой — и дело не в коде, а в логике.
Две типичные ошибки:
train и test перед импутацией — утечка данныхРешение — MissForestPredict:
train и честно применить к test — без утечки и переобучения.#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2😁2😢1
This media is not supported in your browser
VIEW IN TELEGRAM
🐳 Docker за 2 минуты для Data Scientists
Даже если вы используете Docker каждый день, мало кто понимает, что происходит «под капотом».
Вот главное, что нужно знать:
1️⃣ Docker Client
— Вы вводите команды (
— Клиент общается с Docker Daemon через API
2️⃣ Docker Host
— Здесь работает Daemon
— Он строит образы, запускает контейнеры и управляет ресурсами
3️⃣ Docker Registry
— Хранит Docker-образы
— Docker Hub — публичный, компании часто используют приватные registry
⚡️ Что происходит, когда вы запускаете docker run:
1. Docker проверяет локальный кэш, если образа нет — скачивает из registry
2. Создаёт контейнер из образа
3. Выделяет read-write файловую систему для контейнера
4. Настраивает сетевой интерфейс
5. Запускает контейнер
Зачем это важно для DS:
✔️ Контейнеризация упрощает воспроизводимость экспериментов
✔️ Легче отлаживать ML-пайплайны и Jupyter-окружения
✔️ Docker позволяет масштабировать проекты и запускать модели на разных машинах
😉 Теперь вы знаете, где «смотреть», если что-то ломается в контейнере.
🐸 Библиотека дата-сайентиста
#буст
Даже если вы используете Docker каждый день, мало кто понимает, что происходит «под капотом».
Вот главное, что нужно знать:
— Вы вводите команды (
docker run, docker build)— Клиент общается с Docker Daemon через API
— Здесь работает Daemon
— Он строит образы, запускает контейнеры и управляет ресурсами
— Хранит Docker-образы
— Docker Hub — публичный, компании часто используют приватные registry
⚡️ Что происходит, когда вы запускаете docker run:
1. Docker проверяет локальный кэш, если образа нет — скачивает из registry
2. Создаёт контейнер из образа
3. Выделяет read-write файловую систему для контейнера
4. Настраивает сетевой интерфейс
5. Запускает контейнер
Зачем это важно для DS:
😉 Теперь вы знаете, где «смотреть», если что-то ломается в контейнере.
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍6❤3🔥2🎉1🙏1
🎥 Paper2Video — автоматическая генерация видео из научных статей
Paper2Video — это инструмент, который превращает научные статьи в видео автоматически.
Он анализирует текст, таблицы и изображения из PDF и создаёт короткий ролик, объясняющий содержание статьи.
🌍 Доступен на английском и китайском.
📱 Github
🐸 Библиотека дата-сайентиста
#буст
Paper2Video — это инструмент, который превращает научные статьи в видео автоматически.
Он анализирует текст, таблицы и изображения из PDF и создаёт короткий ролик, объясняющий содержание статьи.
🌍 Доступен на английском и китайском.
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰5❤3⚡1👍1👏1🎉1
Кто был Томас Бейес, имя которого носят байесовские модели?
Anonymous Quiz
82%
Математик и священник
7%
Астроном
6%
Учёный IBM
5%
Коллега Ньютона
👍4🙏2