Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.37K photos
119 videos
64 files
4.81K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Если дела в команде аналитиков не ладятся, все либо паникуют, либо зовут дата-инженера.

Пока что таких специалистов мало, поэтому, возможно, позовут именно вас. Раскрыть себя в новой роли поможет курс «Data-инженер»: научитесь проектировать модели данных, строить рабочий пайплайн в облаке и упаковывать в него искусственный интеллект.

Нестыдные проекты для портфолио тоже будут. Узнать больше о программе обучения и профессии → http://netolo.gy/fuj
Обзор четырёх популярных NLP-моделей

RNNLM, Word2vec, GloVe и fastText. История создания, варианты использования, преимущества и недостатки четырёх моделей обработки естественного языка.

https://proglib.io/w/a736df85
Создавай цифровые решения будущего и получи приз!

Мы объявляем онлайн-хакатон VirusHack от Ростелекома, организованный в партнерстве с Агентством инноваций Москвы и РАЭК. В нем вы прокачаете свои навыки в разработке технологий, которые помогут людям, бизнесу и государству приспосабливаться к нестандартным условиям жизни.

Победитель реализует свой проект при поддержке крупнейших компаний страны!

Призовой фонд хакатона 2 500 000 рублей!

Онлайн-хакатон пройдет с 3 по 5 мая 2020 года — успейте зарегистрироваться на него до 30 апреля 2020-го: https://proglib.io/w/50413f6d

Добавляйтесь в чат хакатона: https://bit.ly/2RAQgOx
Как пандемия влияет на финансовые рынки: анализ данных

Какое влияние оказывает COVID-19 на финансовые рынки: анализируем текущую ситуацию и сравниваем с тем, как реагировал глобальный рынок на минувшие пандемии.

https://proglib.io/w/35d59239
Пожалуйста, присылайте вопросы, которые вам задавали на собеседованиях, в бота @data_science_interviews_bot (желательно с ответами). Мы будем анонимно публиковать ваши вопросы с решениями в этом канале. Этим вы можете помочь развитию нашего сообщества. Бот: @data_science_interviews_bot. Спасибо!
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «Пожалуйста, присылайте вопросы, которые вам задавали на собеседованиях, в бота @data_science_interviews_bot (желательно с ответами). Мы будем анонимно публиковать ваши вопросы с решениями в этом канале. Этим вы можете помочь развитию нашего сообщества. Бот:…»
Deep Learning for NLP and Speech Recognition (2019)
Авторы: Uday Kamath, John Liu, James Whitaker

В этом учебнике описывается архитектура глубокого обучения с приложениями к различным задачам NLP, включая классификацию документов, машинный перевод, языковое моделирование и распознавание речи. С широким распространением глубокого обучения, обработки естественного языка (NLP) во многих областях (включая финансы, здравоохранение и правительство) существует растущая потребность в одном всеобъемлющем ресурсе, который сопоставляет методы глубокого обучения с NLP и речью и обеспечивает понимание использования инструментов и библиотек для реальных приложений. В своей книге авторы объясняют работу последних методов глубокого обучения, применимых к обработке естественного языка, предоставляют современные подходы и предлагают практические примеры с кодом.

Скачать книгу
👍1
​​Как понять ценность продукта для пользователей? Самый эффективный показатель — продуктовые метрики.

В среду, 29 апреля в 19:00 (мск) ребята из ProductStar проводят бесплатный интенсив для начинающих аналитиков: «Простыми словами о метриках».

👩‍🏫 Кто выступит?

Михаил Морозов, Analytics Team Lead в Skyeng

👨‍🏫 О чем пойдет речь?

— На вебинаре вместе с Мишей поговорим, какие бывают метрики у продукта.
— Расскажем на пальцах, что такое распределение метрики и зачем его оценивать.
— Разберём, как прогнозировать метрики, когда никто ни в чём не уверен.
— На примере Skyeng покажем, как распределение метрик помогает аналитику сделать крутой прогноз и оценить влияние новых фич.

🔥 Два самых активных участника вебинара получат сертификат на бесплатное обучение в ProductStar.

Участие бесплатное, но регистрация обязательна.

Зарегистрироваться на вебинар 👉 @ProductStarAnalyticsBot
Анимация графиков в Python за 4 шага

Преобразуем датафрейм в gif-анимацию. Краткий туториал по анимированной визуализации данных с помощью Python и библиотеки moviepy на примере распространения COVID-19.

https://proglib.io/w/acb4440d
Google BigQuery: The Definitive Guide: Data Warehousing, Analytics, and Machine Learning at Scale (2019)
Авторы: Valliappa Lakshmanan, Jordan Tigani

Эта практическая книга является руководством по Google BigQuery, который предоставляет возможность проводить интерактивный анализ больших наборов данных. BigQuery позволяет предприятиям эффективно хранить, запрашивать, принимать и работать со своими данными в удобной среде. Из этой книги вы узнаете, как анализировать данные в масштабе, чтобы эффективно получать информацию из больших наборов данных.

Скачать книгу