Снова китайцы, а точнее создатели ТикТок - Bytedance представили новую модель OmniHuman-1 для генерации реалистичных видео с людьми на основе одного изображения и движущих сигналов — аудио, видео или их комбинации. Благодаря новой стратегии смешанного обучения, модель эффективно использует масштабные данные и преодолевает нехватку качественных наборов, характерную для предыдущих подходов. OmniHuman создаёт детализированные и правдоподобные видео даже при слабых входных данных, особенно аудио. Модель поддерживает изображения любого формата — от портретов до полного роста — и демонстрирует высокое качество в различных сценариях.
Мощный ход, учитывая что Sora с людьми не в ладах (она пока вообще ни с чем особо не справляется с первого раза)👌
Больше примеров тут✨
Мощный ход, учитывая что Sora с людьми не в ладах (она пока вообще ни с чем особо не справляется с первого раза)👌
Больше примеров тут✨
⚡1
Основатель компании по созданию гуманоидных роботов Figure сделал громкое заявление🦾 ждём, смотрим, потираем руки😏
может внедрили китайскую R1 в своего робтика🫥❗️❓
Для справки: В марте 2024 года компании OpenAI и Figure объявили о сотрудничестве, направленном на разработку нового поколения моделей искусственного интеллекта для роботов-гуманоидов. В рамках этого партнерства OpenAI интегрировала свои передовые языковые модели в робота Figure 01. Компания привлекла $675 млн инвестиций от таких компаний, как Microsoft, OpenAI, NVIDIA и других, что повысило оценочную стоимость компании до $2,6 млрд.
Приятно видеть что вышли из под зависимости Closed AI и Сэма Хайпмана👌
А вообще 2025 мне нравится всё больше, прорыв на прорыве👁
может внедрили китайскую R1 в своего робтика🫥❗️❓
Для справки: В марте 2024 года компании OpenAI и Figure объявили о сотрудничестве, направленном на разработку нового поколения моделей искусственного интеллекта для роботов-гуманоидов. В рамках этого партнерства OpenAI интегрировала свои передовые языковые модели в робота Figure 01. Компания привлекла $675 млн инвестиций от таких компаний, как Microsoft, OpenAI, NVIDIA и других, что повысило оценочную стоимость компании до $2,6 млрд.
Приятно видеть что вышли из под зависимости Closed AI и Сэма Хайпмана👌
А вообще 2025 мне нравится всё больше, прорыв на прорыве👁
🔥4❤🔥1🤔1
Хм, DeepSeek дропнули новую визуальную модельку на hf ✨
Пробуем тут https://huggingface.co/spaces/deepseek-ai/deepseek-vl2-small
Пробуем тут https://huggingface.co/spaces/deepseek-ai/deepseek-vl2-small
Futuris
В общем я продолжаю эксперименты с Gemini 1.5 Pro и решил проверить как мой промпт для текстовых рпг будет работать с 1м токенов и это пушка🔥 Наконец-то бесконечное (можно сделать примерно 1.5к ходов), связанное, текстовое приключение в любом стиле бесплатно…
Напомню, что это одно из лучших развлечений, которые я пробовал с LLMками (кроме кодинга и рисования), а теперь с новыми модельками играть станет ещё интереснее🤓
Вот мой обновлённый промпт кому интересно для начала приключений🧙♂️
Вот мой обновлённый промпт кому интересно для начала приключений🧙♂️
Telegram
Futuris
В общем я продолжаю эксперименты с Gemini 1.5 Pro и решил проверить как мой промпт для текстовых рпг будет работать с 1м токенов и это пушка🔥 Наконец-то бесконечное (можно сделать примерно 1.5к ходов), связанное, текстовое приключение в любом стиле бесплатно…
👍4❤2🤗2👾1
This media is not supported in your browser
VIEW IN TELEGRAM
Прогерам приготовиться! GitHub представил новый режим агента для Copilot в VS Code (может работать на o3-mini). Теперь AI-ассистент может не только помогать программистам, но и самостоятельно исправлять ошибки в коде, проводить юнит-тесты, предлагать терминальные команды и анализировать сбои во время выполнения программы. Режим агента способен распознавать дополнительные задачи, необходимые для реализации основного запроса, и выполнять их без участия человека👌
Обзорчик тут https://youtu.be/of--3Fq1M3w?si=JG3JX5JmbSOcA1zo
Обзорчик тут https://youtu.be/of--3Fq1M3w?si=JG3JX5JmbSOcA1zo
🔥9🙈4👎2
А вот это мощно 💥
Китай строит гигантский лазерный комплекс для термоядерного синтеза
Спутниковые снимки показывают масштабный X-образный объект под Мьянъяном (провинция Сычуань), который, по мнению аналитиков, может стать крупнейшим в мире лазерным комплексом для исследований термоядерного синтеза.
Цель проекта — получение чистой энергии путем слияния изотопов водорода под воздействием лазеров. Однако эксперты не исключают связь с разработкой ядерного оружия, так как установка позволяет моделировать условия ядерных взрывов.
Комплекс, предположительно на 50% больше американского аналога NIF, где в 2022 году впервые достигли положительного энергобаланса, ускорил строительство после пандемии. Китай демонстрирует амбиции в «термоядерной гонке», что вызывает опасения Запада: без активных инвестиций США и их союзники могут уступить лидерство.
Источник
Китай строит гигантский лазерный комплекс для термоядерного синтеза
Спутниковые снимки показывают масштабный X-образный объект под Мьянъяном (провинция Сычуань), который, по мнению аналитиков, может стать крупнейшим в мире лазерным комплексом для исследований термоядерного синтеза.
Цель проекта — получение чистой энергии путем слияния изотопов водорода под воздействием лазеров. Однако эксперты не исключают связь с разработкой ядерного оружия, так как установка позволяет моделировать условия ядерных взрывов.
Комплекс, предположительно на 50% больше американского аналога NIF, где в 2022 году впервые достигли положительного энергобаланса, ускорил строительство после пандемии. Китай демонстрирует амбиции в «термоядерной гонке», что вызывает опасения Запада: без активных инвестиций США и их союзники могут уступить лидерство.
Источник
CNN
China is building a giant laser facility to master near-limitless clean energy, satellite images appear to show
The X-shaped building in southwestern China could help China pull ahead in the race to master a futuristic clean energy source and amp up weapons research
⚡10👍6❤3🌚1🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Общение с ChatGPT через годик (или уже в этом🌚) будет выглядеть так:
😁8👻8😈4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, если сейчас с помощью шэрскрина новая Gemini 2.0 может делать работу радиолога (помогать ему), то что будет через годик - другой 🌚
❤11🔥5⚡2😱2
Интересное: тут специалисты из Microsoft Research, Лаборатории языковых технологий Кембриджского университета и Института автоматики Китайской академии наук разработали метод "Мультимодального визуального мышления" (MVoT), направленный на улучшение пространственного рассуждения в больших языковых моделях (LLM) и мультимодальных моделях (MLLM). MVoT позволяет моделям создавать изображения, отражающие их мыслительные процессы, что повышает точность в сложных задачах. Эксперименты показали, что MVoT эффективно справляется с динамическими пространственными задачами, превосходя традиционные цепочки рассуждений в сложных сценариях. Этот метод открывает новые возможности для решения задач, где визуальное мышление дополняет вербальное.
FEEL THE AGI👁
FEEL THE AGI👁
🔥9🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот как должен выглядеть настоящий ИИ-собеседник (а не просто окно чатика)🩶 зафайнтюнить Vector Robot можно по туториалам тут и тут
🔥10❤🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Luma.ai обновился и вроде неплохо так, ждём когда бесплатные конкуренты подятнутся 🌚
🔥6❤🔥4
Media is too big
VIEW IN TELEGRAM
Первый пошёл - 11и минутная ИИ-короткометражка по Звёздным Войнам✨ смотрится не хуже последних фильмов от Диснея, даже бой на мечах кое как получился👌 Представляю, какие шедевры от настоящих фанов мы ещё посмотрим по пути к сингулярности 🌚
Спсиок ии-приблуд для создания в титрах, но понятно, что Google Veo2 тут основа, такое consistency пока что есть только у него. Звук, голос и музыка — всё тоже AI-generated
P.S.
К таким видео пока нужно относиться проще и смотреть на перспективу, ещё вчера создать такое в домашних условиях в одиночку за пару дней было невозможно, сегодня — это реально, а представьте, что будет возможно условно уже завтра
Спсиок ии-приблуд для создания в титрах, но понятно, что Google Veo2 тут основа, такое consistency пока что есть только у него. Звук, голос и музыка — всё тоже AI-generated
P.S.
К таким видео пока нужно относиться проще и смотреть на перспективу, ещё вчера создать такое в домашних условиях в одиночку за пару дней было невозможно, сегодня — это реально, а представьте, что будет возможно условно уже завтра
👍10💩5👀3🤔2🎃2🤩1
OpenAI (а точнее Сэм) анонсировал обновление дорожной карты для GPT-4.5 и GPT-5. Компания упрощает модельный ряд и убирает выбор модели, возвращаясь к «магическому» объединённому интеллекту. В ближайшие недели выйдет GPT-4.5 (Orion) — последняя модель без цепочки рассуждений. Позже GPT-5 станет универсальной системой, интегрирующей технологии o-серии, а o3 больше не будет доступен отдельно. Бесплатные пользователи получат неограниченный доступ к GPT-5 на стандартном уровне интеллекта, а подписчики Plus и Pro — доступ к более продвинутым версиям.
LETs Gooo💫
Чую DeepSeek R2 на подходе🌚
LETs Gooo💫
Чую DeepSeek R2 на подходе🌚
🌚9🔥6🤔2
YouTube интегрировал новую модель генерации видео Veo 2 от Google DeepMind. Теперь пользователи могут создавать уникальные AI-видеофоны или генерировать отдельные видеоклипы, которые можно добавлять в любые Shorts. Эти функции сейчас доступны в США, Канаде, Австралии и Новой Зеландии, с планами расширения на другие регионы в будущем. (кому нужно - юзайте VPN)
Чтобы включить Veo 2 в YouTube Shorts, откройте камеру Shorts, выберите «Зелёный экран», затем перейдите в Dream Screen и введите текстовый запрос для генерации видео.
Похоже началось..(хорошо что я шортсы не смотрю🌚)
Чтобы включить Veo 2 в YouTube Shorts, откройте камеру Shorts, выберите «Зелёный экран», затем перейдите в Dream Screen и введите текстовый запрос для генерации видео.
Похоже началось..(хорошо что я шортсы не смотрю🌚)
blog.youtube
Imagine it, create it: Veo 2 is coming to YouTube Shorts
😱10💩5