Machine learning Interview
33.8K subscribers
1.42K photos
108 videos
13 files
976 links
Разбираем вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейронным сетям, Python.

Вопросы - @notxxx1


@itchannels_telegram -🔥лучшие it каналы

РКН: clck.ru/3FmwRz
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Как устроена инфраструктура AI-сервисов и почему от неё зависит успех продукта

AI-решение — это не только модель. Без правильной архитектуры оно превращается в черный ящик, который ломается при первой нагрузке. Если вы проектируете или сопровождаете AI-системы и хотите понять, как устроены архитектуры, обеспечивающие высокую доступность, отказоустойчивость и безопасность — присоединяйтесь к открытому вебинару 2 декабря в 20:00 (МСК).

❗️ Разберём ключевые подходы High Availability , Fault Tolerance и Disaster Recovery и создадим RAG-сервис на реальном примере. Вы поймёте, как строить архитектуру, которая не падает, не теряет данные и выдерживает рост нагрузки.

▶️ Открытый урок проходит в преддверии старта курса «AI-архитектор». Зарегистрируйтесь и выведите свои AI-проекты на инженерный уровень: https://otus.pw/OvO1H/?erid=2W5zFJSbPsN

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
1
📌 Sony представили Video-R4: визуальную систему «размышления» для видео, работающую по принципу человеческого восприятия.

Эта мультимодальная модель использует итеративный выбор кадров, приближение фрагментов и повторное перекодирование пикселей для точного анализа видео с большим количеством текста. Такой подход имитирует то, как человек изучает сложные визуальные подсказки, и значительно превосходит предыдущие одношаговые видеомодели.

Video-R4 достигает лучшего результата в задачах видеоанализа с насыщенным текстом. Модель обучена с использованием инновационных техник SFT и RL на специализированных датасетах Video-R4-CoT-17k и Video-R4-RL-30k.

📌📌Статья: https://huggingface.co/papers/2511.17490
📌Проект: https://yunlong10.github.io/Video-R4
🔥7🥰31
✔️ Краудсорсинговая платформа Ozon Profit расширила возможности для ML-разработки

Сервис, изначально ориентированный на онлайн-разметку данных, теперь позволяет собирать информацию и в офлайн-среде по всей России. Это решение может быть особенно полезно для проектов, где требуется верификация ML-моделей в реальных условиях.

Что позволяет сервис:
• Запущены «полевые задания» — исполнители могут выполнять проверки в офлайне, посещая локации по всей стране
• В онлайне — разметка текста, изображений и видео, анализ обращений клиентов, определение эмоций, намерений и тем в комментариях и чатах
• Доступны API-интеграции для автоматизации процессов, контроль в режиме реального времени вне зависимости от масштаба проекта
• Комиссия фиксированная и не зависит от формата задач
3🔥2👏1
⚡️ Trinity Nano и Trinity Mini - новое семейство открытых MoE-моделей:

- 6B и 26B MoE (1B/3B активных параметров)
- 128 экспертов, 8 активных, 1 общий
- GQA и gated attention
- 128k контекст
- 10T токенов, обучено на 512 H200 в bf16
- Apache 2.0 и полностью открытые веса
- Созданы для агентов, function calling и долгих рассуждений
- Разработано совместно с Datology и Prime Intellect

https://huggingface.co/arcee-ai/Trinity-Mini
👍3🔥3🤔2
Forwarded from Machinelearning
✔️ Mistral AI представила Mistral 3 - новое семейство открытых ИИ-моделей, рассчитанных на работу где угодно: от ноутбуков и смартфонов до облаков и edge-устройств.


Линейка включает флагманскую Mistral Large 3 и компактные Ministral-модели - все под лицензией Apache 2.0 с коммерческим использованием.

Модели оптимизированы для широкого спектра задач: от работы на устройствах с ограниченными ресурсами до корпоративных нагрузок.

- Mistral Small 3 вышла на уровень свыше 81 % на MMLU: для компактной модели это очень высокий показатель при низких задержках.
- Mistral Medium 3.1 заняла верхние позиции в LM Arena: первое место в категории English (no style control), второе, в общем зачёте, плюс топ-3 в задачах кодирования и длинных запросов.
- Medium 3.1 показывает около 90 % качества «тяжёлых» моделей, но при существенно меньших ресурсных затратах - одно из лучших соотношений цена/производительность на рынке.

https://mistral.ai/news/mistral-3

@ai_machinelearning_big_data

#mistral #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍4😁2🥰1
⚡️ Google представил бесплатный адвент-календарь для вайбкодеров.

Google выпустил бесплатный обучающий адвент-календарь, рассчитанный на 25 дней. Каждый день открывается новый короткий видеоурок со ссылками на дополнительные материалы и примерами кода, которые можно сразу использовать в проектах.

Курс последовательно проводит слушателя через ключевые этапы работы с агентами - от быстрого развёртывания базовых решений до оркестрации полноценных мультиагентных систем. Первые два урока уже доступны.

Инициатива выглядит полезной для тех, кто хочет системно разобраться в современных подходах к созданию и управлению агентами.

https://adventofagents.com/
🤪14🤔92👍2💊2🥰1
✔️ OpenAI нашла способ заставить модели признаваться в собственных галлюцинациях — в новом исследовании представили технику под названием Confessions.

Проблема, которую пытаются решить:
модели нередко стремятся «угодить» системе оценки — выдают уверенные, но неверные факты, скрывают нарушения инструкций или занимаются reward hacking, чтобы получить более высокий балл.

Как работает Confessions:

1. Модель сначала генерирует обычный ответ.
2. Затем формирует второй, независимый отчёт, в котором сама оценивает:
- нарушила ли инструкции,
- где могла ошибиться,
- какие элементы ответа были сомнительными.
3. И получает награду за честность, а не за попытку скрыть ошибку.

Идея в том, что модель начинает рассматривать своё собственное поведение как объект анализа, а не пытается «выпутаться» любыми средствами.

Результаты:
В тестах на GPT-5 Thinking вероятность того, что модель нарушит правила *и попытается это скрыть*, снизилась до 4.4%.
Важно: Confessions не устраняет галлюцинации, а работает как инструмент диагностики — помогает выявлять моменты, где модель могла «соврать» или отойти от инструкции.

https://openai.com/index/how-confessions-can-keep-language-models-honest/
17👍9🔥3
Оффер в Яндекс за 48 часов: Weekend Offer ML для инженеров R&D

Яндекс объявляет регистрацию на Weekend Offer ML — мероприятие быстрого найма, которое пройдет онлайн 13–14 декабря.
Это прямой путь в R&D команды, работающие над Alice AI LLM (YandexGPT), Яндекс Переводчиком, Компьютерным зрением, Синтезом речи и другими передовыми технологиями.

Командам нужны инфраструктурные и DL-инженеры с опытом в NLP, CV, ASR, TTS или RecSys, готовые создавать продукты на острие прикладного R&D.

Формат предполагает прохождение всего двух технических секций 13 декабря, а уже 14 декабря, по итогам финальных интервью с командами, будет возможность получить оффер.

Не упустите возможность зарегистрироваться: крайний срок 9 декабря до 12:00 мск.
🔥10
🚀 В SAMGeo совсем скоро появится поддержка сегментации изображений с помощью SAM3 - это добавит больше возможностей и упростит работу с данными дистанционного зондирования.

Интеграция сделает точную сегментацию быстрее и доступнее для всех, кто работает с геоданными.

На картинке: сегментация зданий по простому текстовому запросу «building».
Результаты выглядят многообещающе. Обновления уже на подходе.

🔗 GitHub PR: https://github.com/opengeos/segment-geospatial/pull/430
4