Вместо жёстко обученного классификатора модель принимает на вход вашу собственную политику безопасности и рассуждает, соответствует ли сообщение этой политике.
Результат - не просто «безопасно/небезопасно», а цепочка рассуждений, которую вы можете проверить и улучшить.
Модели вышли в двух размерах: 120B и 20B.
• gpt-oss-safeguard-120B
• gpt-oss-safeguard-20B
💡 Зачем нужны:
•Политики можно менять без переобучения модели
• Подходит для нишевых или быстро меняющихся рисков (например, читерство в играх или фейковые отзывы)
• Не требует тысяч размеченных примеров
• Идеален, когда важна объяснимость, а не минимальная задержка
Обе доступны под лицензией Apache 2.0 - их можно свободно использовать, модифицировать и разворачивать.
🔗 Официальный анонс
🤗 Hugging Face
@ai_machinelearning_big_data
#openai #chatgpt #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥164👍124😁93👏23🤔20🎉16❤12🤩9🗿4🙏2💯2
Если тренируете LLM и упираетесь в лимиты по скорости обучения или в число GPU — есть решение на интенсиве от ШАДа и Яндекс Образования — LLM Scaling Week.
Инженеры из команды YandexGPT покажут решения, которые помогут масштабировать модели и снижать затраты на GPU.
За время интенсива:
✔️ Поймешь, как переходить от экспериментов к масштабу на примере реального продакшена
✔️ Научишься масштабировать и ускорять модели
✔️ Разберешься, как перейти с одной GPU на десятки, не сжигая бюджет
✔️Освоишь современные подходы к увеличению эффективности обучения LLM: FP8, Triton, параллелизмы, Mixture of Experts
Участие в LLM Scaling Week бесплатное, регистрация на интенсив продлится до 13 ноября — по ссылке
Инженеры из команды YandexGPT покажут решения, которые помогут масштабировать модели и снижать затраты на GPU.
За время интенсива:
✔️ Поймешь, как переходить от экспериментов к масштабу на примере реального продакшена
✔️ Научишься масштабировать и ускорять модели
✔️ Разберешься, как перейти с одной GPU на десятки, не сжигая бюджет
✔️Освоишь современные подходы к увеличению эффективности обучения LLM: FP8, Triton, параллелизмы, Mixture of Experts
Участие в LLM Scaling Week бесплатное, регистрация на интенсив продлится до 13 ноября — по ссылке
👍129🤩33👏14❤12🤣9🎉7🔥3👌2🥱1🗿1
💴 Капитализация Nvidia превысила $5 трлн - впервые в истории компания достигла такой оценки.
За пять лет акции $NVDA подскочили более чем на 1500%. Производитель чипов зарабатывает на взрывном спросе со стороны Microsoft, OpenAI и других игроков ИИ-рынка.
Пока все искали золото, Nvidia продавала лопаты - и стала самой дорогой компанией в мире.
@ai_machinelearning_big_data
#Nvidia
За пять лет акции $NVDA подскочили более чем на 1500%. Производитель чипов зарабатывает на взрывном спросе со стороны Microsoft, OpenAI и других игроков ИИ-рынка.
Пока все искали золото, Nvidia продавала лопаты - и стала самой дорогой компанией в мире.
@ai_machinelearning_big_data
#Nvidia
👍167🎉63😁37🔥22❤12👏9🥱9🤔7🤩5😍2💅1
This media is not supported in your browser
VIEW IN TELEGRAM
Новая версия делает работу с агентами и кодом ещё гибче и удобнее:
- Мульти-агенты - теперь можно запускать до 8 агентов параллельно, каждый работает в своей изолированной копии кода.
- Composer: первая собственная агентская модель Cursor, которая оптимизирована под длинный контекст и инструменты (с производительностью в ~4× выше, по сравнению с аналогичными по «интеллекту» моделями.)
- Backend-абстракция - легко переключаться между локальной системой, виртуальной машиной или базой данных.
- Встроенный Browser - агенты теперь сами тестируют веб-приложения, кликают по элементам
- Новый Code Review - удобный просмотр изменений без постоянных переключений между файлами.
- Sandboxed Terminals - команды выполняются в безопасной среде без доступа в интернет.
- Team Commands - единые команды и настройки для всей команды разработчиков.
- Voice Mode - управление агентом голосом и голосовые запросы.
- Ускоренный LSP - быстрее работает автодополнение и анализ кода в больших проектах.
- Plan Mode in Background - планирование и выполнение задач теперь можно разделять и выполнять параллельно.
- Cloud Agents - мгновенный запуск и высокая стабильность (99.9% аптайма).
- Enterprise-функции - централизованный контроль, hooks и аудит действий пользователей.
Подробнее: https://cursor.com/changelog/2-0
@ai_machinelearning_big_data
#Cursor
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤97👍56👏18🔥16🎉8🤗5🆒2💅1
Anthropic проверили, способны ли большие языковые модели осознавать собственные «мысли» и внутренние состояния.
Для эксперимента они использовали технику внедрения концептов - добавления определённого паттерна активности в нейроны модели.
Например, они внедряли сигнал “ALL CAPS” - это шаблон, соответствующий тексту, написанному ЗАГЛАВНЫМИ БУКВАМИ. Если такая активация появляется внутри сети, значит, модель «думает» о тексте, который нужно сделать капсом.
После внедрения исследователи спрашивали модель: *«Ты чувствуешь, что что-то изменилось?»*
В 20% случаев Claude 4.1 правильно замечал вмешательство ещё до того, как сам использовал капс, то есть распознавал изменение внутри себя.
В другом эксперименте учёные подменяли слово в ответе (например, добавляли слово “bread”) и проверяли, осознаёт ли модель, что это не её собственное намерение.
После внедрения мысли Claude начинал считать это слово своим выбором и придумывал обоснования, как будто у него есть память о решении.
Модели также смогли управлять своими внутренними состояниями: по команде «думай об этом» активность усиливалась, по команде «не думай» - ослабевала.
Авторы отмечают -
Интроспекция работает лишь в определённых сценариях - мы пока не знаем, насколько она масштабируема или применима ко всем моделям и задачам
Нужен дальнейший анализ: подтверждение, что то, что мы видим - не просто имитация, а действительно внутренний механизм самосознания
Главный вывод исследования: хотя модели пока далеки от настоящей интроспекции, они уже частично способны “заглядывать внутрь себя” и понимать, что происходит в их нейронных процессах.
https://www.anthropic.com/research/introspection
@ai_machinelearning_big_data
#Anthropic #llm
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍298🤔170😐122❤69👏65🔥52🥰34👨💻18✍16🙏16👌7
Media is too big
VIEW IN TELEGRAM
Это World-модель, работающая сразу с двумя потоками - текстом и пикселями и предсказывающая их совместное состояние на каждом шаге.
- 🔥 Обучена на 10T+ чередующихся vision-language токенов и доведена RL - в результате модель демонстрирует сильное мультимодальное рассуждение и генерация
- ⚡ Новый подход DiDA (Discrete Diffusion Adaptation) —- Discrete Diffusion Adaptation переводит последовательное декодирование в параллельное двустороннее «денойзинг»-предсказание в дискретном пространстве токенов - в итоге это дает примерно 20× быстрее инференс без потери качества.
По метрикам модель превосходит Nano Banana в генерации, редактировании и интерливинговых задачах.
@ai_machinelearning_big_data
#Emu3 #MultimodalAI #WorldModel #NextTokenPrediction
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥86👍36❤21🎉9🤩7👏6🤔4💯3
🧾 Microsoft раскрыла цифры, которые показывают масштабы расходов OpenAI.
В отчёте для SEC видно: OpenAI потеряла около $11.5 млрд за один квартал.
Это считается по методу учёта доли — Microsoft владеет примерно 27% OpenAI и списала у себя $3.1 млрд. Если 27% = $3.1 млрд убытка, то общий минус - около $11.5 млрд.
Ещё один факт: Microsoft уже перечислила $11.6 млрд из обещанных $13 млрд - почти всё финансирование уже пришло в OpenAI.
И при этом Microsoft за тот же период заработала $27.7 млрд чистой прибыли, так что такой минус она спокойно выдерживает.
Гонка за лидерство в ИИ - это игра, где даже крупнейшие компании готовы сжигать гигантские суммы.
Интересно посмотреть, сколько она ещё продлится и кто выдержит дольше?
theregister.com/2025/10/29/microsoft_earnings_q1_26_openai_loss
@ai_machinelearning_big_data
#opanai #Microsoft #money
В отчёте для SEC видно: OpenAI потеряла около $11.5 млрд за один квартал.
Это считается по методу учёта доли — Microsoft владеет примерно 27% OpenAI и списала у себя $3.1 млрд. Если 27% = $3.1 млрд убытка, то общий минус - около $11.5 млрд.
Ещё один факт: Microsoft уже перечислила $11.6 млрд из обещанных $13 млрд - почти всё финансирование уже пришло в OpenAI.
И при этом Microsoft за тот же период заработала $27.7 млрд чистой прибыли, так что такой минус она спокойно выдерживает.
Гонка за лидерство в ИИ - это игра, где даже крупнейшие компании готовы сжигать гигантские суммы.
Интересно посмотреть, сколько она ещё продлится и кто выдержит дольше?
theregister.com/2025/10/29/microsoft_earnings_q1_26_openai_loss
@ai_machinelearning_big_data
#opanai #Microsoft #money
👍86🤔80🔥31❤23🤓16😐7😁6🤗2
This media is not supported in your browser
VIEW IN TELEGRAM
С ним за столом сидели руководители Samsung и Hyundai.
@ai_machinelearning_big_data
#Nvidia
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤234👍69🍾43😁17🥰12🥱6👏5🔥3🗿2
🔥 Hugging Face снова выкатили полезные материалы.
Вышел бесплатный плейбук о том, как изнутри строят SOTA-модели.
Без общих слов - только реальные решения и нюансы, которые обычно скрыты внутри исследовательских команд.
Это полноценный мастеркласс на 214 страниц для тех, кто хочет понимать, как устроены современные LLM.
Что внутри:
• Логика построения модели: зачем → что → как
• Как разработчики берут модель и по частям включают/выключают компоненты (или меняют их)
• Архитектура: ключевые выборы и trade-offs
• Искусство подбора и очистки данных
• Как проходит обучение моделей
• Пост-тренинг и RLHF в 2025
• Инфраструктура больших моделей
По первым страницам - уровень деталей как в Ultra-scale playbook.
Ссылка: https://huggingface.co/spaces/HuggingFaceTB/smol-training-playbook#designing-the-model-architecture
@ai_machinelearning_big_data
#AI #LLM #MachineLearning #HuggingFace
Вышел бесплатный плейбук о том, как изнутри строят SOTA-модели.
Без общих слов - только реальные решения и нюансы, которые обычно скрыты внутри исследовательских команд.
Это полноценный мастеркласс на 214 страниц для тех, кто хочет понимать, как устроены современные LLM.
Что внутри:
• Логика построения модели: зачем → что → как
• Как разработчики берут модель и по частям включают/выключают компоненты (или меняют их)
• Архитектура: ключевые выборы и trade-offs
• Искусство подбора и очистки данных
• Как проходит обучение моделей
• Пост-тренинг и RLHF в 2025
• Инфраструктура больших моделей
По первым страницам - уровень деталей как в Ultra-scale playbook.
Ссылка: https://huggingface.co/spaces/HuggingFaceTB/smol-training-playbook#designing-the-model-architecture
@ai_machinelearning_big_data
#AI #LLM #MachineLearning #HuggingFace
🔥95❤27🥰9🤩3