Знаешь эту вечную проблему в супермаркете на весовой кассе? «Это что за сорт яблок?» — и начинается долгий поиск по базе. Для розничных сетей это не просто минута времени, а миллионы убытков. Но, кажется, решение пришло из мира open-source.
Инженер из Yandex Cloud, Сергей Нестерук, исследователи Сколтеха и ГУАП выкатили в открытый доступ крупнейший в мире датасет PackEat для компьютерного зрения в ритейле. И это не просто картинки из лаборатории.
Что внутри этого «монстра» данных?
▪️ 100+ тысяч фото, на которых больше 370 тысяч отдельных фруктов и овощей.
▪️ 34 вида и 65 сортов — от яблок и картошки до более экзотичных позиций.
▪️Все снимки сделаны в реальных магазинах, со всеми «прелестями»: товары в пакетах, навалом, с шумным фоном и частично перекрывают друг друга. То есть, условия — максимально реалистичные.
Зачем это все? Этот датасет — топливо для обучения нейросетей, которые смогут:
▫️ С ходу определять не только вид, но и сорт продукта.
▫️ Сегментировать каждый объект, даже если яблоки лежат горкой.
▫️ Автоматически считать количество единиц.
Исследования показывают, что точность таких моделей может достигать 92%, что в разы сокращает ошибки.
Где найти и использовать? Вся информация открыта:
1. Статья — в журнале Scientific Data.
2. Сам датасет изображений — на платформе Zenodo.
3. Код и примеры моделей — на Kaggle.
Это большой шаг к тому, чтобы «умные кассы» и системы учета перестали путать Аврору с Гренни Смит и начали реально экономить деньги бизнесу. А для разработчиков — отличный инструмент, чтобы создавать крутые retail-решения. #нейросети #компьютерноезрение #датасет #retailtech #ии #open_source
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥16❤8🗿5🙈2⚡1👨💻1