Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.38K photos
119 videos
64 files
4.82K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
#вопросы_с_собеседований
Пара вопросов с интервью по глубокому обучению.

1. Что произойдет, если learning rate установлен неточно (слишком низкий или слишком высокий)?
2. Что такое гиперпараметры?
Что произойдет, если learning rate установлен неточно (слишком низкий или слишком высокий)?

Когда LR слишком маленький, обучение модели будет продвигаться очень медленно, поскольку на каждом шаге мы минимально обновляем веса. До достижения точки минимума потребуется много обновлений.

Если LR установлен слишком большим, это вызывает нежелательное отклоняющееся поведение по отношению к функции потерь из-за резких обновлений весов. Алгоритм может не найти точку минимума.
Вакансия редактора-копирайтера

Онлайн-портал образовательных материалов для IT-специалистов Библиотека программиста (https://proglib.io) ищет автора статей для подготовки публикаций

— Что делать:

— Подготовка нативных материалов по IT-тематике согласно контент-плану. Темы: программирование (Java, Python, Go), iOS/Android-разработка,  информационная безопасность, Data Science, Big Data, тестирование ПО.

— Редакторская работа со структурой материала под ключ.

— Коммуникация с командой по внесению правок.

— Факт-чекинг, корректура написанных материалов.

Требования:

— Опыт написания материалов для IT-медиа, продукта или компании.  

— Понимание целевой аудитории и SEO-оптимизации.

— Умение написания материалов, полезных как для читателя, так и заказчика.

— Знание английского языка для  чтения и перевода иностранных источников.

— Приветствуется знание основ программирования и других направлений в IT-сфере.

— Готовность к выполнению тестового задания (оплачиваемое, в случае удачного прохождения).

— Работа в команде с главным редактором.

Условия:

— Удаленная работа с соблюдением дедлайнов.  

— Оплата по количеству знаков 500 руб - 1000 знаков, выплаты два раза в месяц.

— С кем связаться:

Откликнуться на вакансию: @brilliant_stone. Присылайте несколько предложений о себе и опыте работы, ссылки на примеры публикаций. Резюме присылать не нужно. В случае взаимного интереса, мы пришлем вам тестовое задание.
Что такое гиперпараметры?

Применяя нейронные сети, вы обычно работаете с гиперпараметрами, если данные правильно отформатированы. Гиперпараметр - это параметр, значение которого устанавливается перед началом процесса обучения. Он определяет, как обучается сеть и ее структуру. Например, гиперпараметрами являются количество скрытых слоёв, learning rate, эпохи и т. д.
Machine Learning for Beginners (2019)
Автор: Ethem Mining
Количество страниц: 712

Машинное обучение используется в здравоохранении, сельском хозяйстве, кибербезопасности, распознавании лиц, таргетинге и ретаргетинге клиентов в онлайн-рекламе, рекомендации продуктов, видео, текстах и т. д., беспилотных автомобилях, ценообразовании в реальном времени, прогнозировании поведения человека и многом другом. Данная книга написана для тех, кто хочет начать развиваться в сфере машинного обучения.

Скачать книгу
Три лучшие книги для начинающих специалистов по данным

Улучшите свои навыки анализа данных, изучив эти три ключевые книги.

https://proglib.io/w/b37c74e5
Linear Algebra and Learning from Data (2019)
Автор: Gilbert Strang
Количество страниц: 432

Это учебник, который поможет читателям узнать, какие умственные шаги привели математиков к глубокому обучению. В ней описываются многие концепции линейной алгебры, так или иначе повлиявшие на развитие Deep Learning. Автор также рассказывает о различных структурах нейронных сетей.

Скачать книгу
ОГО! Спасибо! Очень приятно. Если хотите, можете тоже поддержать нас пожертвованием в ВК: vk.com/proglib
Датасеты TensorFlow: неприятные особенности

Загрузчик данных TensorFlow построен на основе последовательного доступа. Это вводит некоторые потенциально важные подводные камни для проектов. Узнайте, что это за проблемы и когда их следует избегать.

https://proglib.io/w/87303fa0
👩🏼‍💻 Коллеги из «Лаборатории Касперского» инвестируют более половины прибыли в реальные бонусы для сотрудников, обучают более 10 языкам и hard/soft skills, предлагают лучший ДМС на рынке. Посмотрите на ТОП-7 вакансий, которые мы собрали специально для вас:

1. Fullstack Web Developer (Linux, PostgreSQL, .Net Core, C#, Angular)

2. Angular Developer (KICS for Networks)

3. Java developer (защита от таргетированных атак)

4. Team Lead (Команда разработки безопасных решений для мобильных телефонов на основе KasperskyOS)

5. SDET / Test Engineer (KasperskyOS Mobile)

6. C/C++ Developer (TrustZone/TEE, KasperskyOS)

7. Архитектор С/С++ KasperskyOS (KOS SDK)
🤼 Генеративно-состязательная нейросеть: ваша первая GAN-модель на PyTorch

Подробная инструкция построения генеративно-состязательных нейросетей (GAN) на примере двух моделей, реализованных с помощью фреймворка глубокого обучения PyTorch.

https://proglib.io/sh/5m0hlCBGuO
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «👩🏼‍💻 Коллеги из «Лаборатории Касперского» инвестируют более половины прибыли в реальные бонусы для сотрудников, обучают более 10 языкам и hard/soft skills, предлагают лучший ДМС на рынке. Посмотрите на ТОП-7 вакансий, которые мы собрали специально для вас:…»
Machine Learning for Algorithmic Trading (2020)
Автор: Stefan Jansen
Количество страниц: 820

Стремительный рост цифровых данных повысил спрос на опыт в торговых стратегиях, использующих машинное обучение. Это исправленное и расширенное издание учит создавать и оценивать сложные модели обучения с учителем, без учителя и обучения с подкреплением.
Книга знакомит с комплексным машинным обучением для торгового процесса, от разработки идеи до оптимизации моделей, реализации стратегии и тестирования на исторических данных. Автор иллюстрирует стратегии на примерах, начиная от линейных моделей и ансамблей деревьев до методов глубокого обучения из передовых исследований.

Скачать книгу
📊 11 популярных библиотек Python для Data Science

Одна из причин ценности Python для Data Science заключается в огромной коллекции библиотек анализа и визуализации данных. В этой статье мы рассмотрели самые популярные.

https://proglib.io/sh/jHCehvnKPr
В этом уроке вы создадите автоматический решатель головоломки судоку с использованием OpenCV, глубокого обучения и оптического распознавания символов.

https://proglib.io/w/6203736b