Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.38K photos
119 videos
64 files
4.82K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Пятничный #дайджест для ML-специалистов

🔹Краткий гайд по квантованию нейросетей
Статья рассказывает о методах уменьшения битности данных, что позволяет сократить вычислительные ресурсы и уменьшить объём памяти, необходимой для хранения моделей.

🔹Differential Transformer
Статья от Microsoft, рассказывающая о борьбе с нерелевантным контекстом в LLM.

🔹Как научить LLM понимать видео? Обзор подходов
Сбер сделал обзор походов к анализу и пониманию видео.

🔹The LLM Evaluation guidebook
Это репозиторий с гайдом от Hugging Face по методам оценки больших языковых моделей.
👍31
#дайджест #DataInternship

Подборка стажировок недели для Data специалистов

▪️ Data Engineering Intern / Стажер дата-инженер
Офис (Москва), Procter & Gamble
Подробнее

▪️ Стажер аналитик данных
Офис (Москва), Ozon Офис и Коммерция
Подробнее

▪️ Стажер-аналитик данных мобильных приложений
Удалёнка, IndieElevate
Подробнее

▪️ Стажер-аналитик Big Data
Офис (Самара) / Удалёнка, IBS
Подробнее

▪️ Стажер-аналитик в команду транзакционных операций Банка
Гибрид (Москва), ВТБ
Подробнее

Понравились предложения о стажировке?
❤️ — да
🤔 — нет
6
#дайджест #DataInternship

Подборка стажировок недели для Data специалистов

▪️ Стажер Data Scientist в матчинг и группировки
Удалёнка (РФ) / Гибрид (Москва), Ecom.tech
Подробнее

▪️ Стажёр в Big Data (Аналитика)
Офис (Москва), АТОЛ
Подробнее

▪️ Data engineer (Стажер)
Офис (Москва), Sapiens solutions
Подробнее

▪️ Стажер-аналитик в HR / Data Analyst Intern
Гибрид (Москва), Okkam
Подробнее

▪️ Machine Learning Engineer
Удалёнка, ALTWeb Group
Подробнее

Понравились предложения о стажировке?
❤️ — да
🤔 — нет
Пятничный #дайджест по Data Science и Machine Learning

🔹GPUStack — менеджер кластеров GPU для запуска больших языковых моделей (LLM)
Инструмент поддерживает различные аппаратные платформы, включая Mac, Windows и Linux, и позволяет легко масштабировать операции, добавляя больше GPU или узлов.

🔹Практика: мой опыт интеграции более 50 нейронных сетей в один проект
Статья на Хабре описывает опыт автора по проекту, ориентированному на создание и редактирование видео, изображений и аудио.

🔹FireDucks — ускорь Pandas в сто раз
Это повышающая производительность библиотека, которая полностью совместима с pandas API.

🔹Philosophy of an Experimentation System — MLOPs Intro
Статья обсуждает проблемы, возникающие при разработке моделей машинного обучения, и предлагает структурированный подход к организации экспериментов.

🔹The Polars vs pandas difference nobody is talking about
Автор рассказывает о различиях между библиотеками Polars и pandas, особенно в контексте выполнения группировок и агрегаций.
👍5😁4
#дайджест #DataInternship

Подборка стажировок недели для Data специалистов

▪️ Аналитик-стажер
Гибрид (Москва), Nestle
Подробнее

▪️ Аналитик Excel (стажер)
Офис (Омск), T2. Tech
Подробнее

▪️ Стажер/Data Engineer (блок "Стратегия и развитие")
Гибрид (Москва), Сбер
Подробнее

▪️ Intern / Cтажер / BI-разработчик
Гибрид (Москва), НИЖФАРМ
Подробнее

▪️ Data Engineering Intern / Стажер дата-инженер
Офис (Москва), Procter & Gamble
Подробнее

Понравились предложения о стажировке?
❤️ — да
🤔 — нет
3👍2