Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.38K photos
119 videos
64 files
4.82K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🎥 Paper2Video — автоматическая генерация видео из научных статей

Paper2Video — это инструмент, который превращает научные статьи в видео автоматически.

Он анализирует текст, таблицы и изображения из PDF и создаёт короткий ролик, объясняющий содержание статьи.

🌍 Доступен на английском и китайском.

📱 Github

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰63👍2👏21🎉1
🆕 Свежие новости для дата‑сайентистов

🚀 Модели и обучение
Умный Early Stopping — новый подход к остановке обучения нейросетей: анализируем тренд, а не шум, чтобы избежать преждевременной остановки.
Передовые алгоритмы глубокого обучения — обзор современных DL-алгоритмов и архитектур, актуальных для 2025 года.
BERT — одноэтапная диффузия текста — новая интерпретация работы BERT через призму диффузионных моделей.

🛠 Практика и инструменты
Как автоматизировать тестирование батч-моделей —пошаговый гайд по организации тестов ML-моделей в пакетном режиме.
10 локальных UI для LLM — краткий обзор популярных интерфейсов для работы с LLM локально на ПК.
Coral NPU для Edge AI — Google представляет открытое решение для low-power AI на периферийных устройствах и wearables.
ChatGPT Atlas: браузер с встроенным ChatGPT — новый браузер превращает ChatGPT в супер-ассистента, объединяя инструменты, контекст и поиск в одном месте.

🧠 Карьерные и исследовательские наблюдения
Джун глазами синьора: 5 ошибок в резюме — какие ошибки снижают шансы попасть в ML-команду, и как их исправить.
Типичные DS-специалисты и роль ИИ — как часто DS используют AI для генерации кода и какие навыки остаются ключевыми.

🐸 Библиотека дата-сайентиста

#свежак
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1🔥1🥰1
🧠 Готовишься к собесам, а ноутбук еле тянет IDE?

Самое время прокачать скиллы и апгрейднуть железо!

Proglib Academy разыгрывает MacBook Pro 14 (M3 Pro, 36 GB, 1 TB SSD) 💻

Купи любой наш курс до 15 ноября → пройди 2 недели обучения → напиши куратору #розыгрыш. Всё, ты в игре!

📚 Среди курсов:

▫️ Алгоритмы и структуры данных — топ для подготовки к собесам в Яндекс и FAANG.

▫️ Архитектуры и шаблоны проектирования — чтобы думать как senior.

▫️ Python, математика для DS, основы IT и другие направления.

👉 Принять участие
Вы начали изучать Python, установили библиотеки, попробовали что-то запустить — и всё внезапно сломалось?

Не переживайте, это случалось с каждым. Просто вы не изолировали окружение. На открытом уроке курса «Machine Learning. Basic» мы разберём, как грамотно настроить виртуальное окружение, чтобы работать с Python и ML-библиотеками спокойно и системно.

Вы узнаете, что такое venv, conda и uv, как управлять зависимостями и подключать Jupyter Notebook к своему окружению. Настроим всё пошагово — без сложных терминов и магии.

➡️ Присоединяйтесь 28 октября в 20:00 (МСК). Уверенный старт в Python и машинном обучении начинается с чистого окружения. Регистрация открыта: https://clc.to/sec-CA

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
🔥1
📊 Underfitting vs Overfitting — простая шпаргалка

Сохраняем полезность! Когда обучаем модель, важно не сделать её слишком тупой и не слишком умной. Нужно балансировать.

🔛 Underfitting (недообучение): модель слишком простая, не уловила закономерности.

Признаки:
🌠 Высокая ошибка на train и test
🌠 График ошибок почти не улучшается

Как исправить:
🌠 Увеличить сложность модели
🌠 Добавить больше признаков
🌠 Дольше обучать

🔛 Overfitting (переобучение): модель выучила данные наизусть, но не умеет обобщать.

Признаки:
🌠 На train всё идеально
🌠 На test ошибка высокая

Как исправить:
🌠 Добавить регуляризацию
🌠 Упростить модель
🌠 Добавить данных или аугментацию
🌠 Использовать early stopping / dropout

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍3🔥2🎉2
⚡️ Lightning запускает облако для PyTorch-разработчиков

Компания Lightning (PyTorch Lightning) представила новый набор инструментов для ускорения обучения моделей в облаке: распределённое обучение, reinforcement learning и эксперименты — всё в одном месте.

Что нового:
I code editor — помощь PyTorch-«экспертов» для быстрого кодинга, отладки и деплоя на GPU
Environments hub — интерактивные среды для RL и распределённого обучения, масштабируемые и самодостаточные
Meta integrations — запуск Monarch (distributed training), OpenEnv (RL среды) и torchforge (эксперименты RLHF)

✔️ Полезно для исследователей и разработчиков, которые хотят ускорить эксперименты и масштабировать модели без локальных ограничений.

👉 Ссылка

🐸 Библиотека дата-сайентиста

#свежак
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
🎁 Конкурс от Proglib Academy!

Кстати, если кто-то ещё не в курсе — у нас тут раздают MacBook Pro 14.
Да-да, не шутка, настоящий, железный, с M3 Pro

Но! Чтобы успеть пройти 2 недели обучения к 15 ноября, курс нужно взять до конца октября — и сейчас на всё скидка 40%.

Чтобы поучаствовать, нужно:

1️⃣ Покупаешь любой курс до конца октября;
2️⃣ Проходишь 2 недели обучения к 15 ноября;
3️⃣ Написать куратору в чат #розыгрыш.

До 15 ноября, потом всё — поезд (и макбук) уйдёт.

👉 Участвовать в розыгрыше
This media is not supported in your browser
VIEW IN TELEGRAM
🙌 TensorTonic — LeetCode, но для машинного обучения

Что вас ждёт внутри:
— Практика ML-алгоритмов в формате LeetCode
— Воспроизведение современных ML-исследований на практике
— Подготовка к AI-собеседованиям по конкретным компаниям
— Свежие ML-блоги и разборы

Версия v1 уже доступна, проект активно развивается.

🔗 Ссылка на сайт

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🙏21
📦 Zip-файлы для AI/ML проектов

KitOps меняет подход к упаковке, версионированию и обмену AI/ML проектами.

Создаёте ModelKit — это как zip-файл, который включает всё: модель, данные, код и настройки.

100% open-source
Без головной боли с MLOps

➡️ Сохраняйте и делитесь проектами легко.

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
Топчешься на уровне Middle? 🤔 Хватит это терпеть!

На продвинутом курсе «Machine Learning. Advanced» ты наконец разберешься с тем, что действительно делает из Data Scientist — Senior:

MLOps и Docker — чтобы твои модели стабильно работали в продакшене, а не только в твоем ноутбуке
Продвинутый NLP (Transformer, BERT) — для работы с современными текстовыми моделями
Graph Neural Networks — чтобы решать задачи, где данные — это связи, а не просто точки

Прокачайся до уровня, где ты не просто пишешь код, а проектируешь ML-системы!

Хватит сомневаться — проверь себя!

👉Пройди тест на курс и получи максимальную скидку до 31.10 по промокоду MLADV_10

🚀Оставь заявку на обучение — начни свой путь к Senior Level уже сегодня: https://clc.to/BXeVIQ

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
3🥰1🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
👍 Каждый тензор в движении: Illustrated Transformer 3D

Погрузитесь в LLaMA как никогда раньше:
— Каждый тензор и операция — в движении
— Кликайте на любой компонент и смотрите точные строки кода, которые его запускают

Новый способ учить и изучать LLM.

🆕 Попробовать можно по ссылке.

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍2😢1
📘 7 шаблонов для построения Multi-Agent систем

Если вы работаете с LLM-агентами — сохраните эту шпаргалку.

👏 Эти паттерны — фундамент для создания масштабируемых и надёжных multi-agent систем.

🐸 Библиотека дата-сайентиста

#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1🔥1😢1
🎃 Хэллоуин в Proglib Academy: скидки, призы и... немного паники

Сегодня 31 октября, и это не просто время тыкв и призраков, это ПОСЛЕДНИЙ ДЕНЬ, когда ты можешь выиграть макбук!

→ Купи любой курс со скидкой 40% 💸
→ Начни обучение, чтобы пройти 2 недели к 15 ноября 🎓
→ Напиши куратору #розыгрыш ✍️

Всё! Теперь ты в игре.

👉 Сейчас или никогда!