Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.36K photos
119 videos
64 files
4.81K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Наборы данных временных рядов спутниковых изображений

На этой странице представлен список наборов данных спутниковых изображений с временным измерением и спутниковых видео для различных задач компьютерного зрения и глубокого обучения.

Читать статью
👍2
PINN (Physics-informed neural networks) и с чем их едят

Реальные физические системы обсчитываются сложными численными методами за очень большое время на суперкомпьютерах. Но есть нейронные сети, которые делают это быстрее (пусть и с меньшей точностью).

Читать статью
👍5👾1
panflute: Фильтры для Pandoc

panflute — это пакет Python, который делает создание фильтров Pandoc увлекательным.
Подробное руководство пользователя, документацию и инструкции по установке см. на странице.

Открыть репозиторий
👍4
Что такое ансамбль методов?

Ансамбль методов — это использование нескольких алгоритмов с целью получения более высокой эффективности прогнозирования, чем можно было бы получить, используя эти алгоритмы отдельно.
#вопросы_с_собеседований
👍4
7 способов совместного использования массива NumPy между процессами

Если вы выполняете многопроцессорную обработку с помощью NumPy, вам нужно будет передавать массивы между процессами. В этой статье рассматриваются различные способы сделать это.

Читать статью
👍4
Виджеты Jupyter стали проще с anywidget

anywidget — это библиотека Python, которая упрощает создание пользовательских виджетов Jupyter. Это позволяет быстро создавать прототипы, а поскольку это Python, её можно использовать в разных средах.

Читать статью
👍2
Утечка данных в машинном обучении: виды, последствия, варианты предотвращения на примерах реальных датасетов.

https://habr.com/ru/companies/vk/articles/746360/
🔥2
В работе используете linux, macOS или Windows? Расскажите в комментариях ⬇️
#интерактив
Отношение разработчиков к AI/ML

Stack Overflow дополнительно исследует мнение технологов об использовании инструментов ИИ.

Читать статью
Подборка бесплатных курсов по Python и машинному обучению. Сохраняй, чтобы не потерять и когда-нибудь пройти!

1. Ускоренный курс по машинному обучению — основы машинного обучения, включает видеолекции от исследователей из Google.

2. Основы Python для анализа данных — программирование на Python.

3. Введение в Data Science и аналитику — все основы Data Science и Data Science Life Cycle.

4. Линейная регрессия — как использовать R для реализации линейной регрессии, одного из наиболее распространенных подходов к статистическому моделированию

5. Основы R — как обрабатывать, анализировать и визуализировать данные.

6. Визуализация — основные принципы визуализации данных и способы их применения с помощью ggplot2.

7. Введение CS50 в программирование на Python, май 2023 г.
13👍3
🚩 5 красных флагов: как из текста вакансии понять, что компания — не очень

Как определить работодателя-абьюзера в АйТи? Объясняем на реальных примерах.

Читать статью
👍11
🔍 ТОП-12 джоб-сайтов: где программисту разместить резюме и найти работу

Рассказываем про мир job-сайтов: где программисту опубликовать резюме, чтобы быстрее найти работу в IT.

Читать статью
👍1
Темный лес исследований и разработок и капиталовложений в ИИ

В то время как на первый взгляд мы в основном просто видим большие раунды инвестиций, в действительности компании ИИ, возможно, являются одними из самых сложных бизнесов, которые мы когда-либо создавали в сфере технологий. Выполнение основных исследований и разработок модели ИИ требует игры в 4D-шахматы с исследовательскими сообществами, накопления и использования капитала, привлечения талантов, понимания конкуренции и коммерциализации….

Читать статью
👍21
Что такое нормализация данных и зачем она нам нужна?

Нормализация данных — очень важный этап предварительной обработки, используемый для изменения масштаба значений, чтобы они соответствовали определенному диапазону, чтобы обеспечить лучшую сходимость во время обратного распространения ошибки. В общем случае она сводится к вычитанию среднего значения и делению на стандартное отклонение.

Если этого не сделать, некоторые признаки будут иметь более высокий вес в функции стоимости. Нормализация позволяет сделать все признаки одинаково взвешенными.
#вопросы_с_собеседований
👏102👍2