Google объявил о запуске новой модели EmbeddingGemma, созданной для работы прямо на устройствах - без подключения к интернету. Модель на 308 миллионов параметров, поддерживает более 100 языков и показывает лучшие результаты среди всех открытых моделей размером до 500 млн параметров по тесту MTEB.
После квантования модель кушает менее 200 МБ оперативной памяти, а генерация эмбеддингов занимает всего около 20 миллисекунд на устройствах с EdgeTPU.
Google внедрил технологию Matryoshka Representation Learning, позволяющую использовать разные размеры векторов - от 768 до 128 - в зависимости от задач и ресурсов устройства. Контекстное окно достигает 2000 токенов.
EmbeddingGemma уже интегрируется с популярными инструментами вроде SentenceTransformers, Llama.cpp, LangChain и Transformers.js, а её веса открыты для использования и коммерческой адаптации.
googleblog
Вышла новая open-source модель Kani-TTS-370M, создающая естественное и выразительное звучание при крайне высокой скорости работы. Модель насчитывает 370 миллионов параметров и оптимизирована под потребительские GPU, включая RTX 3060, где она обеспечивает реальное время генерации речи.
Kani-TTS построена на сочетании NanoCodec и LFM2-350M, что обеспечивает компактность и качество, сравнимое с крупными нейронными TTS-системами. Разработчики использовали современные нейросетевые методы синтеза речи, чтобы добиться максимально естественной интонации и чистоты звучания.
Главный акцент сделан на эффективности и универсальности - модель легко разворачивается локально, подходит для встраивания в ассистентов, игровых персонажей и офлайн-озвучку, не требуя облачных вычислений.
HF
По оценкам Adobe Analytics, объем онлайн-продаж в США в праздничный сезон 2025 года достигнет $253,4 млрд, что на 5,3 % больше, чем в прошлом году. AI-трафик при этом вырастет на 520 %, особенно в последние 10 дней перед Днём благодарения.
Почти половина американцев намерены воспользоваться AI-инструментами: 53 % - для поиска товаров, 40 %- для рекомендаций, 36 % — для поиска выгодных предложений, 30 % — чтобы вдохновиться идеями подарков.
Мобильные устройства останутся доминирующей платформой - 56,1 % транзакций пройдут с телефона. Среди драйверов роста - скидки (среднее снижение цен до 28 %), сервисы «купи сейчас, заплати позже» и активность в соцсетях, чья рекламная отдача вырастет на 51 %.
techcrunch
Модель обучается не на 3D-структурах, а чисто на видео и многовидовых данных, что делает её универсальной и масштабируемой.
Kaleido превосходит все предыдущие генеративные модели в задачах с малым числом видов и впервые достигает качества рендеринга уровня InstantNGP в zero-shot режиме. Это шаг к гибкому world modeling, способному как точно реконструировать реальность, так и дорисовывать недостающие детали.
shikun
OpenAI и AMD объявили масштабное сотрудничество: по условиям соглашения OpenAI развернёт 6 гигаватт графических процессоров AMD, начиная с первой волны - 1 гигаватт Instinct MI450 во второй половине 2026 года.
AMD, чтобы выровнять интересы, выдала OpenAI варрант на 160 млн своих акций, который будет реализован по мере достижения этапов развертывания и роста стоимости компании, что может превратить его в ~10 % долю.
Соглашение может принести AMD десятки миллиардов долларов дохода, а также усилить её позиции на рынке чипов для искусственного интеллекта.
Этот шаг позволяет OpenAI диверсифицировать аппаратные поставки и снизить зависимость от одного производителя, а также закладывает мощную основу для масштабных AI-инфраструктур следующих лет.
openai
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍158🔥36❤26🤩13👏7🎉5💘2
This media is not supported in your browser
VIEW IN TELEGRAM
Jules - это ИИ, который умеет писать код, исправлять ошибки и создавать тесты для ваших проектов.
Он подключается к GitHub или другому репозиторию, анализирует кодовую базу и выполняет задачи, которые вы ему задаёте.
С помощью Jules Tools можно запускать и управлять этим агентом напрямую через терминал, без браузера.
Пример, вводите:
jules remote new --session "fix login bug"
После запуска команда создаёт виртуальную машину, клонирует репозиторий, решает задачу и отправляет pull request с готовым исправлением.
Что интересного:
- Командная строка и API для управления агентом
- Асинхронные задачи и параллельное выполнение
- Скрипты и автоматизация (через CI, cron, pipelines)
- Память и адаптация под ваш стиль кода
- Безопасное хранение ключей и токенов
- Интерактивный интерфейс в терминале (TUI) с отображением статуса задач в реальном времени
TUI-режим напоминает веб-панель, но работает прямо в консоли, позволяя быстро запускать, отслеживать и управлять сессиями.
Jules можно интегрировать с Slack или системами сборки - агент сам создаёт и выполняет задачи, пока вы занимаетесь другими делами.
Если агент сталкивается с проблемой, то приостанавливает работу и запрашивает помощь, а не «угадывает» решение.
Обе утилиты - Jules и Gemini CLI - работают на Gemini 2.5 Pro, но Jules ориентирован на короткие и точные задачи, а Gemini CLI - на длительную совместную работу.
Бесплатная версия позволяет запускать 15 задач в день (до 3 одновременно).
Платные тарифы - $19.99 и $124.99 - дают лимиты до 100 и 300 задач.
Google также планирует добавить поддержку GitLab, Bitbucket и локальных проектов без Git.
@ai_machinelearning_big_data
#Google #Jules #AI #CodingAgent #Gemini25Pro #Automation
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥145👍25❤23🎉12👏7😁6🤩5🥰2🤣2🫡2
Media is too big
VIEW IN TELEGRAM
Создание AI-агентов становится одной из самых востребованных профессий на рынке.
Теперь вы можете научиться этом на курсе.
Курс научит вас реализовывать четыре ключевых паттерна дизайна агентов:
- Reflection - как агент анализирует свои ответы и улучшает их
- Tool use - модель выбирает, какие инструменты использовать (поиск, почта, календарь, код и т.д.)
- **Planning**- ИИ планирует и разбивает задачу на подзадачи
- Multi-agent collaboration - взаимодействие нескольких агентов, как сотрудников в команде
Andrew Ng делает акцент на оценке (evals) и анализе ошибок - ключевых навыках для успешной отладки агентных систем.
В курсе есть практика, где можно создадите deep research-агента, который умеет искать, синтезировать и формировать отчёты, применяя все эти паттерны.
- Все уроки и код на Python
- Очень подробно и пошагало объяснены все вунтренности
- В курсе рассматриваются для самые популярные фреймворками для создания ИИ агентнов
Требование для учащихся - базовые знания Python
@ai_machinelearning_big_data
#AI #AgenticAI #AndrewNg #DeepLearningAI #AIagents
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩185👍44❤27👏16💯9🔥6🎉6🙏5😁2🤬1💘1
Media is too big
VIEW IN TELEGRAM
Мишель Деворе (Michel Devoret), главный научный сотрудник команды Google Quantum AI, стал лауреатом Нобелевской премии по физике 2025 года.
Он разделил награду с Джоном Мартинесом (бывшим сотрудником Google Quantum AI) и Джоном Кларком из Калифорнийского университета в Беркли.
Премия присуждена за исследования макроскопических квантовых эффектов, которые стали фундаментом для создания сверхпроводящих кубитов - ключевой технологии в квантовых компьютерах.
Для Google это исторический момент: теперь в числе сотрудников и выпускников компании уже пять лауреатов Нобелевской премии, включая Демиса Хассабиса и Джеффри Хинтона, отмеченных в 2024 году.
По данным *The Information*, Oracle понесла убытки около $100 млн за прошлый квартал из-за аренды чипов Blackwell.
Маржа серверного проката составила всего около 16%.
Бизнес по аренде GPU оказывается сложным:
скорее всего, дело не в падении спроса, а в сильном давлении на маржу - клиенты активно торгуются и сбивают цены.
theinformation
Модель содержит 8.3 млрд параметров, из которых активно только 1.5 млрд на токен, что даёт качество уровня 3–4B плотных моделей, но при этом она быстрее Qwen3-1.7B.
Модель показала себя отлично на 16 банчмарках:
она обгоняет LFM2-2.6B и модели аналогичного размера, особенно в задачах математики, кода и творческого письма.
huggingface
Deloitte объявила о крупнейшем корпоративном внедрении AI в истории Anthropic - Claude теперь станет рабочим инструментом для 470 000 сотрудников по всему миру.
Компания создаёт отраслевые версии Claude для бухгалтеров и разработчиков, а также откроет Claude Center of Excellence и сертифицирует 15 000 специалистов. В фокусе - прозрачность и соответствие нормам, с опорой на фреймворк Trustworthy AI.
Любопытно, что накануне Deloitte признала, что использовала ИИ в официальном отчёте правительства Австралии, где оказались поддельные цитаты и ссылки, и согласилась вернуть часть контракта на $440 000.
TechCrunch
Пациент Nick Wray стал первым, кто с помощью Neuralink PRIME BCI смог управлять роботизированной рукой напрямую с помощью мозга. Он рассказал, что впервые за многие годы смог сам надеть шляпу, разогреть еду и поесть без помощи.
В проекте участвует и xAI Илонa Маска: система Grok помогает Neuralink усиливать нейроинтерфейс — от преобразования мыслей в текст и ускоренной коммуникации до синтезированного голоса и долгосрочной цели — когнитивного соединения человека и ИИ на бинарном уровне.
Многие задаются вопросом: станет ли Grok 5 шагом к слиянию человеческого сознания и искусственного интеллекта?
Это одно из самых вдохновляющих достижений в истории нейротехнологий — шаг к возвращению физической независимости людям и, возможно, к новой эре взаимодействия человека и ИИ.
Видео
Компания ElevenLabs представила Agent Workflows - инструмент, который позволяет визуально проектировать логику диалогов и взаимодействие агентов на платформе Agents.
Теперь вместо громоздкого единого агента можно создавать Subagents - специализированных подзадачных агентов с собственными промптами, базами знаний и инструментами.
С помощью Workflows можно задавать, когда агент передаёт управление подагенту, а когда подключает человеческого оператора. Это делает систему более гибкой и безопасной.
Кроме того, Workflows обеспечивают надёжное подключение к корпоративным системам, управление бизнес-логикой и умную маршрутизацию диалогов, что помогает снизить затраты, задержки и повысить точность ответов.
elevenlabs
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👏151❤31👍29🎉16🤔6🤩6🙏2🏆2💘1
Модель на 1 трлн, из них ≈ 50 млрд активны на токен (MoE-архитектура).
Она обучена на 20 трлн+ токенов, специально отобранных для задач логического мышления и рассуждений. Контекст: 128 000 токенов.
Построена на базе Evo-CoT (Evolutionary Chain of Thought) и Linguistics-Unit RL - нового метода обучения для масштабируемых рассуждений. При помощи Evo-CoT модель постепенно улучшает баланс между точностью рассуждений и вычислительной эффективностью. То есть с каждым шагом она пытается делать рассуждения «глубже», но не слишком дорого по ресурсам.
Моделька демонстрирует сильные результаты в задачах кода, математики, логики и фронтенд-генерации.
В архитектуре задействованы Mixture-of-Experts (1/32 активация), MTP слои и маршрутизация экспертов.
Ling-1T показывает, что огромные модели можно сделать не только мощными, но и экономичными.
https://huggingface.co/inclusionAI/Ling-1T
@ai_machinelearning_big_data
#Ling1T #AI #ML #OpenSource #Reasoning #TrillionScale #FP8
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍816🤔180❤160🔥147💯121👏97😁69🥰64😐16😢12🤩9