Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.36K photos
119 videos
64 files
4.81K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
✍️ Как провести кросс-валидацию на несбалансированных данных?

При работе с несбалансированными данными важно учитывать особенности распределения классов, чтобы результаты модели были корректными. Вот как это сделать:

Применять Stratified k-Fold
Стратификация — это способ сохранить пропорции классов при разбиении данных. С её помощью можно улучшить метод k-Fold — каждый фолд будет содержать примерно такое же соотношение классов, что и всё исходное множество.

#советы
😍4👍1