Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.36K photos
119 videos
64 files
4.81K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Learn PySpark: Build Python-based Machine Learning and Deep Learning Models (2019)

При помощи книги вы научитесь использовать модели машинного и глубокого обучения и создавать приложения с помощью PySpark, а также работать с real-time data. Эта книга подойдет желающим научиться работать с PySpark для проведения исследовательского анализа данных и решения бизнес-задач. Она рассчитана на специалистов в науке о данных, инженеров, работающих с моделями машинного обучения и глубокого обучения, которые хотят изучать и использовать PySpark для анализа потоковых данных.
10 групп, на которые разделяются алгоритмы машинного обучения (самые популярные).

https://bigdata-madesimple.com/10-groups-machine-learning-algorithms/
Natural Language Processing in Action: Understanding, analyzing, and generating text with Python (2019)

Книга является руководством по созданию программ, обрабатывающих человеческий язык, используя возможности Python с его фреймворками, предназначенными для работы с AI и NLP. Книга расширяет традиционные подходы к NLP, включая нейронные сети, современные алгоритмы глубокого обучения, и объясняет работу решений реальных задач, таких как составление текста и ответы на вопросы в свободной форме. Для комфортного чтения требуется базовое понимание глубокого обучения и средние знания Python.
​​Бесплатные митапы о блокчейн разработке в Казани!

28 января в ИТ-парке г. Казань пройдет встреча, посвященная финтех решениям на блокчейне для банков и крупного бизнеса. Расскажем об использовании технологии в различных бизнес-отраслях, а также покажем архитектуру типовых решений и познакомим с функциональными инструментами разработки и внедрения.
Регистрация по ссылке: http://leader-id.ru/event/41240/?utm_source=dsproglib

29 января в г. Иннополисе эксперты Университета Иннополис, а также компаний-разработчиков блокчейн решений Waves Enterprise и Soramitsu Lab расскажут о кейсах применения технологии на практике и ответят на технические вопросы о внедрении блокчейна.
Регистрация по ссылке: https://oez-innopolis.timepad.ru/event/1240660/?utm_source=dsproglib
Data Science with Python and Dask (2019)

Книга написана для data scintist-ов и разработчиков, имеющих опыт работы с Python и стеком PyData. Она учит читателя создавать масштабируемые проекты, которые могут работать с огромными наборами данных. В книге после знакомства с фреймворком Dask вы проанализируете данные из БД парковочных талонов Нью-Йорка и воспользуетесь DataFrames для оптимизации процесса. Затем вы создадите модели машинного обучения, используя Dask-ML, сделаете интерактивные визуализации и создадите кластеры с помощью AWS и Docker.
Practical Data Science with R (2019)

Авторы показывают, как применять язык программирования R и полезные статистические методы в работе специалиста по анализу данных, и правильно представлять свои результаты любой аудитории. В книге используется практический подход к объяснению основных принципов в постоянно расширяющейся науке о данных. Реальные примеры приводятся сразу после введения в R. Книга рассчитана на опытных читателей, знакомых с data science.
Большие данные крутятся везде: банковский сектор, телеком, ритейл. Активнее всего они используются в маркетинге и разработке. X5 Retail Group, например, рассматривает big data как важнейший бизнес-актив. И доступ к нему имеют все аналитики компании. Так, большие данные уже позволяют менять пространство не только внутри магазинов, но и в целом влиять на инфраструктуру.

Узнать больше о цифровой трансформации ритейла можно тут https://www.x5tech.ru/digest-4-2019
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems (2019)

Благодаря недавней серии прорывов глубокое обучение расширило всю область машинного обучения в целом. Теперь программисты, которые почти ничего не знают о работе этой технологии, могут использовать простые и эффективные инструменты для реализации программ, обучающихся на данных. Книга показывает читателю, как это делается. Используя конкретные примеры, минимум теории и два фреймворка Python — Scikit-Learn и TensorFlow — автор поможет вам получить интуитивное понимание концепций и инструментов для построения интеллектуальных систем. Книга была обновлена после выхода TensorFlow 2.0.