Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.37K photos
119 videos
64 files
4.82K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🆕 Свежие новости для дата‑сайентистов

🚀 Модели и обучение
Умный Early Stopping — новый подход к остановке обучения нейросетей: анализируем тренд, а не шум, чтобы избежать преждевременной остановки.
Передовые алгоритмы глубокого обучения — обзор современных DL-алгоритмов и архитектур, актуальных для 2025 года.
BERT — одноэтапная диффузия текста — новая интерпретация работы BERT через призму диффузионных моделей.

🛠 Практика и инструменты
Как автоматизировать тестирование батч-моделей —пошаговый гайд по организации тестов ML-моделей в пакетном режиме.
10 локальных UI для LLM — краткий обзор популярных интерфейсов для работы с LLM локально на ПК.
Coral NPU для Edge AI — Google представляет открытое решение для low-power AI на периферийных устройствах и wearables.
ChatGPT Atlas: браузер с встроенным ChatGPT — новый браузер превращает ChatGPT в супер-ассистента, объединяя инструменты, контекст и поиск в одном месте.

🧠 Карьерные и исследовательские наблюдения
Джун глазами синьора: 5 ошибок в резюме — какие ошибки снижают шансы попасть в ML-команду, и как их исправить.
Типичные DS-специалисты и роль ИИ — как часто DS используют AI для генерации кода и какие навыки остаются ключевыми.

🐸 Библиотека дата-сайентиста

#свежак
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1🔥1🥰1
🧠 Готовишься к собесам, а ноутбук еле тянет IDE?

Самое время прокачать скиллы и апгрейднуть железо!

Proglib Academy разыгрывает MacBook Pro 14 (M3 Pro, 36 GB, 1 TB SSD) 💻

Купи любой наш курс до 15 ноября → пройди 2 недели обучения → напиши куратору #розыгрыш. Всё, ты в игре!

📚 Среди курсов:

▫️ Алгоритмы и структуры данных — топ для подготовки к собесам в Яндекс и FAANG.

▫️ Архитектуры и шаблоны проектирования — чтобы думать как senior.

▫️ Python, математика для DS, основы IT и другие направления.

👉 Принять участие
Вы начали изучать Python, установили библиотеки, попробовали что-то запустить — и всё внезапно сломалось?

Не переживайте, это случалось с каждым. Просто вы не изолировали окружение. На открытом уроке курса «Machine Learning. Basic» мы разберём, как грамотно настроить виртуальное окружение, чтобы работать с Python и ML-библиотеками спокойно и системно.

Вы узнаете, что такое venv, conda и uv, как управлять зависимостями и подключать Jupyter Notebook к своему окружению. Настроим всё пошагово — без сложных терминов и магии.

➡️ Присоединяйтесь 28 октября в 20:00 (МСК). Уверенный старт в Python и машинном обучении начинается с чистого окружения. Регистрация открыта: https://clc.to/sec-CA

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
🔥1
📊 Underfitting vs Overfitting — простая шпаргалка

Сохраняем полезность! Когда обучаем модель, важно не сделать её слишком тупой и не слишком умной. Нужно балансировать.

🔛 Underfitting (недообучение): модель слишком простая, не уловила закономерности.

Признаки:
🌠 Высокая ошибка на train и test
🌠 График ошибок почти не улучшается

Как исправить:
🌠 Увеличить сложность модели
🌠 Добавить больше признаков
🌠 Дольше обучать

🔛 Overfitting (переобучение): модель выучила данные наизусть, но не умеет обобщать.

Признаки:
🌠 На train всё идеально
🌠 На test ошибка высокая

Как исправить:
🌠 Добавить регуляризацию
🌠 Упростить модель
🌠 Добавить данных или аугментацию
🌠 Использовать early stopping / dropout

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍3🔥2🎉2
⚡️ Lightning запускает облако для PyTorch-разработчиков

Компания Lightning (PyTorch Lightning) представила новый набор инструментов для ускорения обучения моделей в облаке: распределённое обучение, reinforcement learning и эксперименты — всё в одном месте.

Что нового:
I code editor — помощь PyTorch-«экспертов» для быстрого кодинга, отладки и деплоя на GPU
Environments hub — интерактивные среды для RL и распределённого обучения, масштабируемые и самодостаточные
Meta integrations — запуск Monarch (distributed training), OpenEnv (RL среды) и torchforge (эксперименты RLHF)

✔️ Полезно для исследователей и разработчиков, которые хотят ускорить эксперименты и масштабировать модели без локальных ограничений.

👉 Ссылка

🐸 Библиотека дата-сайентиста

#свежак
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
🎁 Конкурс от Proglib Academy!

Кстати, если кто-то ещё не в курсе — у нас тут раздают MacBook Pro 14.
Да-да, не шутка, настоящий, железный, с M3 Pro

Но! Чтобы успеть пройти 2 недели обучения к 15 ноября, курс нужно взять до конца октября — и сейчас на всё скидка 40%.

Чтобы поучаствовать, нужно:

1️⃣ Покупаешь любой курс до конца октября;
2️⃣ Проходишь 2 недели обучения к 15 ноября;
3️⃣ Написать куратору в чат #розыгрыш.

До 15 ноября, потом всё — поезд (и макбук) уйдёт.

👉 Участвовать в розыгрыше
This media is not supported in your browser
VIEW IN TELEGRAM
🙌 TensorTonic — LeetCode, но для машинного обучения

Что вас ждёт внутри:
— Практика ML-алгоритмов в формате LeetCode
— Воспроизведение современных ML-исследований на практике
— Подготовка к AI-собеседованиям по конкретным компаниям
— Свежие ML-блоги и разборы

Версия v1 уже доступна, проект активно развивается.

🔗 Ссылка на сайт

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71👏1🙏1