Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.37K photos
119 videos
64 files
4.81K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
​​Бесплатные митапы о блокчейн разработке в Казани!

28 января в ИТ-парке г. Казань пройдет встреча, посвященная финтех решениям на блокчейне для банков и крупного бизнеса. Расскажем об использовании технологии в различных бизнес-отраслях, а также покажем архитектуру типовых решений и познакомим с функциональными инструментами разработки и внедрения.
Регистрация по ссылке: http://leader-id.ru/event/41240/?utm_source=dsproglib

29 января в г. Иннополисе эксперты Университета Иннополис, а также компаний-разработчиков блокчейн решений Waves Enterprise и Soramitsu Lab расскажут о кейсах применения технологии на практике и ответят на технические вопросы о внедрении блокчейна.
Регистрация по ссылке: https://oez-innopolis.timepad.ru/event/1240660/?utm_source=dsproglib
Data Science with Python and Dask (2019)

Книга написана для data scintist-ов и разработчиков, имеющих опыт работы с Python и стеком PyData. Она учит читателя создавать масштабируемые проекты, которые могут работать с огромными наборами данных. В книге после знакомства с фреймворком Dask вы проанализируете данные из БД парковочных талонов Нью-Йорка и воспользуетесь DataFrames для оптимизации процесса. Затем вы создадите модели машинного обучения, используя Dask-ML, сделаете интерактивные визуализации и создадите кластеры с помощью AWS и Docker.
Practical Data Science with R (2019)

Авторы показывают, как применять язык программирования R и полезные статистические методы в работе специалиста по анализу данных, и правильно представлять свои результаты любой аудитории. В книге используется практический подход к объяснению основных принципов в постоянно расширяющейся науке о данных. Реальные примеры приводятся сразу после введения в R. Книга рассчитана на опытных читателей, знакомых с data science.
Большие данные крутятся везде: банковский сектор, телеком, ритейл. Активнее всего они используются в маркетинге и разработке. X5 Retail Group, например, рассматривает big data как важнейший бизнес-актив. И доступ к нему имеют все аналитики компании. Так, большие данные уже позволяют менять пространство не только внутри магазинов, но и в целом влиять на инфраструктуру.

Узнать больше о цифровой трансформации ритейла можно тут https://www.x5tech.ru/digest-4-2019
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems (2019)

Благодаря недавней серии прорывов глубокое обучение расширило всю область машинного обучения в целом. Теперь программисты, которые почти ничего не знают о работе этой технологии, могут использовать простые и эффективные инструменты для реализации программ, обучающихся на данных. Книга показывает читателю, как это делается. Используя конкретные примеры, минимум теории и два фреймворка Python — Scikit-Learn и TensorFlow — автор поможет вам получить интуитивное понимание концепций и инструментов для построения интеллектуальных систем. Книга была обновлена после выхода TensorFlow 2.0.
Natural Language Processing with PyTorch: Build Intelligent Language Applications Using Deep Learning (2019)

Обработка естественного языка предоставляет безграничные возможности для решения задач в области искусственного интеллекта. Если вы разработчик или data scientist, плохо знакомый с NLP и глубоким обучением, это руководство покажет вам, как применять эти технологии в работе с помощью PyTorch.
Data Science Strategy For Dummies (2019)

С помощью этой книги вы узнаете, как использовать технологии data science в любом бизнесе, большом или маленьком. Более половины всех больших предприятий уже используют науку о данных для получения информации и пользы из больших данных. Автор отвечает на все вопросы касательно внедрения технологий в работу, начиная от самых простых и заканчивая руководством и развитием команды data scientist-ов.