Machine learning Interview

🛰 ComputerRL - новый фреймворк, который учит AI-агентов работать с компьютером так же, как это делает человек.

Главная идея - парадигма API-GUI: агент может и вызывать API, и кликать по кнопкам интерфейса. Благодаря этому исчезает разрыв между машинной автоматизацией и привычным для человека рабочим столом.

Команда Zai проверила ComputerRL на модели GLM-4-9B-0414 и протестировала её на бенчмарке OSWorld. Результат — новый агент AutoGLM-OS-9B, который достиг рекордной точности и уверенно решает задачи автоматизации в desktop-средах.

Проще говоря: теперь AI может не только «понимать» компьютер, но и полноценно работать с ним — запускать программы, управлять окнами и выполнять сложные действия.

📌 Статья
📌 Проект

❤13👍5🔥3

4.78K views13:02

Machine learning Interview

🎯 Новый вектор атак на ИИ — скрытые промпты в картинках

Trail of Bits показали, что хакеры могут прятать инструкции в изображениях. Пока картинка оригинального размера — всё чисто.

Но как только сервис (например, Gemini CLI или **Vertex AI Studio**) автоматически сжимает её, проявляется скрытый текст.

📌 Что это значит:
- ИИ «видит» спрятанный промпт и исполняет его, думая, что это команда пользователя.
- Так можно обойти фильтры и заставить модель делать то, что задумал атакующий.

🛠 Как защититься:
- Инструмент Anamorpher (open-source) для генерации и проверки таких атак.
- Защита: многоуровневая проверка картинок и отслеживание артефактов при масштабировании.

⚠️ Итог: даже безобидная картинка может оказаться «троянским конем» для ИИ-систем.

🔗Github: https://github.com/trailofbits/anamorpher
🔗 Подробнее: blog.trailofbits.com/2025/08/21/weaponizing-image-scaling-against-production-ai-systems/

#AI #Security #PromptInjection #TrailOfBits

🔥22👍9❤5

4.56K views13:00

Machine learning Interview

1:12

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 Генерация видео из кода с Code2Video

Code2Video предлагает инновационный подход к созданию образовательных видео на основе кода. Проект позволяет визуализировать программные концепции, превращая код в наглядные видеоматериалы, что упрощает обучение и понимание.

🚀Основные моменты:
- Генерация видео на основе программного кода.
- Поддержка различных учебных тем.
- Визуализация сложных концепций в доступной форме.
- Открытый доступ к проекту и данным.

📌 GitHub: https://github.com/showlab/Code2Video

#python

🔥23❤10😁3😭3🥰1

4.69K views10:02

Machine learning Interview

🔮 IREE — мост между ML-моделями и железом

Это не просто очередной фреймворк, а целая экосистема для компиляции ML-моделей в универсальное промежуточное представление, которое одинаково хорошо работает и в дата-центрах, и на мобильных устройствах.

Основанный на MLIR инструмент привлёк внимание крупных игроков: AMD использовала его для участия в MLPerf с реализацией SDXL, а сам проект вошёл в LF AI & Data Foundation. Для тех, кто хочет разобраться глубже с его использованием, есть записи выступлений на AsiaLLVM и Vulkanised.

🤖 GitHub

@machinelearning_interview

❤10👍4🥰2

3.97K views13:01

Machine learning Interview

⚡️

Elon Musk’s xAI готовится привлечь $20 млрд — включая $7.5 млрд в виде equity и до $12.5 млрд в виде долга.

Что показано:
- NVIDIA может инвестировать до $2 млрд в equity, причём эта часть финансирована с привязкой к GPU-закупкам.
- Структура сделки включает SPV, которая купит GPU, а сама компания xAI будет их арендовать на пять лет.

Почему это важно:
- схема снижает начальные капитальные затраты xAI — вместо покупки GPU сразу, они арендуют, что даёт гибкость.
- крупный партнёр вроде NVIDIA усиливает доверие к проекту и подчёркивает, что аппаратная база остаётся ключевым фактором в развитии ИИ.
- сочетание equity и долга в таких объёмах говорит о масштабном расширении инфраструктуры и серьёзных вычислительных мощностях.

Возможные риски / вопросы:
- зависимость от условий аренды: стоимость, обеспечение, апгрейды, срок замены оборудования.
- долговая нагрузка может быть большой, особенно если доходы xAI не вырастут по плану.
- риск устаревания оборудования: GPU-поколения меняются, и оборудование может устареть до конца пятилетнего срока аренды.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7👍5❤3

4.26K views10:50

Machine learning Interview

1:14

This media is not supported in your browser

VIEW IN TELEGRAM

Сэм Альтман рассказал очень любопытную деталь о Sora.

Многие правообладатели наоборот хотят, чтобы их персонажи чаще использовались в видео, созданных с помощью Sora.

Пока OpenAI старается провести грань между конфиденциальностью и защитой, владельцы прав всё чаще просят больше открытости и видимости.

Они поняли, что когда пользователи создают креативные или вирусные видео с их персонажами, это повышает вовлечённость аудитории и популярность франшиз.

Ограничивая использование, можно потерять охват - поэтому для многих теперь открытость стала выгодой, а не угрозой.

🟠

Полное интервью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18😁10❤5🔥4

4.4K views11:31

Machine learning Interview

Forwarded from Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

💡

RND1 - новая экспериментальная модель с 30 миллиардами параметров, построенная по архитектуре Sparse Mixture-of-Experts, где активно 3 миллиарда параметров.

Она была преобразована из предварительно обученной авторегрессионной модели (Qwen3-30B-A3B) и затем дополнительно обучена на 500 миллиардах токенов, чтобы полностью поменять поведениие диффузионной модели.

Обычные модели (AR, автогрессионные) пишут текст слово за словом, а RND1 создаёт всё предложение сразу и потом пошагово уточняет его, как будто “проявляет” текст из шума.

Это - Diffusion Language Model (DLM), аналог диффузионных моделей, которые рисуют картинки, только здесь она “рисует” слова.

🔄 Как её сделали

Команда Radical Numerics придумала, как превратить готовую модель в диффузионную без обучения с нуля.

Они просто поменяли тип внимания и дообучили модель на новой задаче.

Этот метод называется AR-to-Diffusion Conversion (A2D) - то есть конверсия из автогрессионной модели в диффузионную.

Как это происходит:
1. Берут сильную GPT-подобную модель.
2. Меняют механизм внимания — теперь модель видит весь контекст сразу.
3. Продолжают обучение по диффузионной задаче.
4. Используют разные скорости обучения для разных частей сети, чтобы модель не забыла старое, но научилась новому способу мышления.

⚙️ Что под капотом

▪ Mixture-of-Experts (MoE) - у модели 30 млрд параметров, но реально работают только 3 млрд за раз. Это делает её мощной, но экономной.

▪ Непрерывное дообучение - старые знания не стираются, а “встраиваются” в новый режим.

▪ Огромные батчи - модель учится на больших партиях данных, чтобы стабилизировать обучение, ведь она не обрабатывает все токены сразу.

✔️ Почему это интересно

- Параллельная генерация - текст создаётся быстрее, без пошаговой задержки.
- Меньше затрат - активных параметров всего 3 млрд, при этом качество как у больших GPT.
- Новая архитектура - открывает дорогу гибридным моделям, сочетающим плюсы AR и DLM.
- Полностью открытый код и веса - можно исследовать, изменять, запускать самому.
- Первый серьёзный шаг к самосовершенствующемуся ИИ- модель может не только обучаться, но и помогать в проектировании следующей версии.

Это реально интересный метод, RND1 показывает, что ИИ можно не просто обучать, а перестраивать - менять его саму логику мышления без начала “с нуля”.

Похоже, это может стать фундаментом для систем Recursive Self-Improvement (RSI), когда ИИ способен создавать и улучшать самого себя.

🟠

Blog: https://radicalnumerics.ai/blog/rnd1

🟠

Code: https://github.com/RadicalNumerics/RND1

🟠

Report: https://radicalnumerics.ai/assets/rnd1_report.pdf

🟠

Веса: https://huggingface.co/radicalnumerics/RND1-Base-0910

@ai_machinelearning_big_data

#RND1 #RadicalNumerics #AI #DLM #DiffusionModel #MoE #OpenSource

Please open Telegram to view this post

VIEW IN TELEGRAM

❤15🔥6👍5🤝2

3.64K views10:46

Machine learning Interview

🧠 LIMIT: Исследование пределов извлечения на основе эмбеддингов

Репозиторий содержит набор данных LIMIT, созданный для проверки моделей эмбеддингов на теоретических принципах. Исследование показывает, что даже современные модели не могут вернуть определенные документы, подчеркивая ограничения текущего подхода с использованием одно-векторных эмбеддингов.

🚀Основные моменты:
- Набор данных для тестирования моделей эмбеддингов.
- Включает 50k документов и 1000 запросов.
- Подчеркивает теоретические ограничения извлечения информации.
- Код для генерации данных и экспериментов доступен в репозитории.

📌 GitHub: https://github.com/google-deepmind/limit

#python

👍9❤8🥰1

4.16K views14:03

Machine learning Interview

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

Учим Python на ферме - вышла новая игра, где вместо фарминга ты пишешь код

Забудь про грядки и полив — теперь ферма работает на Python. Ты управляешь роботами, автоматизируешь процессы и наблюдаешь, как код превращается в урожай.

Вместо мотыги - код, вместо удобрений - алгоритмы.
Это не симулятор фермера, а тренажёр программиста с юмором и логикой.

- Всё управление через код - роботы выполняют твои Python-команды;

- Обучение встроено в геймплей — осваиваешь основы без нудных туториалов;

- Без уровней и доната - ферма растёт вместе с твоими навыками;

- Есть русский язык и IntelliSense, можно писать даже из VS Code;

У игры уже 95% положительных отзывов в Steam.

Игра превращает обучение Python в чистое удовольствие - просто запускаешь и начинаешь “программировать урожай”.

👉 Играть

Please open Telegram to view this post

VIEW IN TELEGRAM

❤29👍13🤣11

4.88K views09:29

Machine learning Interview

🔥 Разбор того, как Mixture-of-Experts (MoE) LLM можно сделать реально дешёвыми, если подогнать архитектуру под железо.

В чём проблема
- MoE включает только часть экспертов на токен → экономия compute.
- Но при больших batch size растут коммуникации и память:
- больше экспертов грузится,
- KV-кэш раздувается,
- узким местом становится память и сеть.

Решение - expert parallelism
- Эксперты размазаны по многим GPU.
- Токен идёт к top-N экспертам + shared-эксперт.
- В DeepSeek: 8 экспертов из 256 на слой × 58 слоёв.

Чтобы справиться с коммуникациями:
- внимание остаётся data parallel (кэш сидит на одном GPU),
- гоняются только маленькие вектора активаций,
- два микробатча: один считает, другой общается,
- горячие эксперты дублируются,
- токены стараются держать экспертов в пределах одного узла.

Оптимизации
- multi-head latent attention → сжатие KV-кэша до ~70KB вместо сотен KB.
- перестройка математики внимания → меньше вычислений при длинных контекстах.
- prefill и decode разделены, кэш даёт ~56% хитов → меньше затрат.

Экономика
- Стоимость = $/GPU-час ÷ токены/час.
- Дешевле при больших batch size, быстрых interconnect, большем числе GPU.
- Но если сервис обещает 20 токенов/сек на юзера → батчи меньше, цена выше.

Практика
- NVLink кластеры масштабируются отлично.
- InfiniBand между DGX - bottleneck.
- 72 GPU при batch 64 → миллиарды токенов в день за ~$0.40 / 1M токенов.

Итог
MoE становятся дёшевыми при:
- больших батчах,
- сжатом KV-кэше,
- грамотном роутинге,
- разделении префилла и декода,
- быстрых interconnect.

Это даёт гибкость: быстрый чат продаётся дороже, а bulk-генерация (синтетика, fine-tune) идёт почти по себестоимости.

https://www.tensoreconomics.com/p/moe-inference-economics-from-first

❤8🔥4👍2

4.19K views11:01

Machine learning Interview

📢 Калифорния первой в США выпустила закон, обязывающий ИИ признавать, что они не люди

Штат принял закон SB 243 - первый в стране, регулирующий AI-чат-ботов-компаньонов.

Основные положения:

▪Если пользователь может подумать, что говорит с человеком, бот обязан показать уведомление, что он искусственный интеллект.

Компании должны иметь протокол предотвращения суицида: блокировать подобный контент и направлять пользователей на горячие линии помощи.

Этот протокол должен быть опубликован на сайте.

При общении с несовершеннолетними бот обязан напоминать каждые 3 часа, что это ИИ, и советовать сделать перерыв.

Запрещено выдавать себя за врача или иного специалиста в области здоровья.

Для подростков должен быть фильтр от сексуального контента.

С июля 2027 года операторы обязаны ежегодно отчитываться в Офисе по предотвращению самоубийств о своих действиях при выявлении риска.

Пользователи смогут подавать в суд на компании — минимум на $1 000 за каждое нарушение.

В тот же день подписаны сопутствующие меры:

Закон SB 53 (сентябрь 2025) — обязывает крупных разработчиков ИИ публиковать протоколы безопасности.

Новые правила о проверке возраста, предупреждениях на соцсетях и штрафах до $250 000 за дипфейк-порнографию.

Закон принят после громких случаев и исков, связанных с вредными взаимодействиями подростков с чат-ботами, включая CharacterAI и дело о гибели пользователя ChatGPT.

techcrunch

#ai #news

👍18🤣11❤5🥰3

4.3K views16:02

Machine learning Interview

Жиза

@machinelearning_interview

👍11❤9😁8🤣3🥰1💯1💊1

3.7K viewsedited 13:57

Machine learning Interview

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 Amurex — это ваш простой, но мощный помощник на основе искусственного интеллекта для проведения совещаний, который легко интегрируется в ваш рабочий процесс!

🌟 Созданный на основе передового искусственного интеллекта, Amurex гарантирует, что вы никогда не упустите ни одной детали, всегда будете в курсе всех дел и сделаете каждое совещание более продуктивным.

🌟 Благодаря таким функциям, как предложения в режиме реального времени, интеллектуальные сводки и последующие электронные письма, Amurex выступает в роли вашего личного второго пилота на всех встречах, экономя время и повышая эффективность.

🔐 Лицензия: AGPL-3.0

🖥

Github

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍5🤔3😁1

3.88K views14:40

About

Blog

Apps

Platform