Futuris
3.82K subscribers
1.17K photos
486 videos
17 files
1.81K links
@Futuris - канал о технологиях, будущем и не только.


Contact @antonod
Download Telegram
Снова китайцы, а точнее создатели ТикТок - Bytedance представили новую модель OmniHuman-1 для генерации реалистичных видео с людьми на основе одного изображения и движущих сигналов — аудио, видео или их комбинации. Благодаря новой стратегии смешанного обучения, модель эффективно использует масштабные данные и преодолевает нехватку качественных наборов, характерную для предыдущих подходов. OmniHuman создаёт детализированные и правдоподобные видео даже при слабых входных данных, особенно аудио. Модель поддерживает изображения любого формата — от портретов до полного роста — и демонстрирует высокое качество в различных сценариях.

Мощный ход, учитывая что Sora с людьми не в ладах (она пока вообще ни с чем особо не справляется с первого раза)👌

Больше примеров тут
1
Основатель компании по созданию гуманоидных роботов Figure сделал громкое заявление🦾 ждём, смотрим, потираем руки😏

может внедрили китайскую R1 в своего робтика🫥❗️

Для справки: В марте 2024 года компании OpenAI и Figure объявили о сотрудничестве, направленном на разработку нового поколения моделей искусственного интеллекта для роботов-гуманоидов. В рамках этого партнерства OpenAI интегрировала свои передовые языковые модели в робота Figure 01. Компания привлекла $675 млн инвестиций от таких компаний, как Microsoft, OpenAI, NVIDIA и других, что повысило оценочную стоимость компании до $2,6 млрд.

Приятно видеть что вышли из под зависимости Closed AI и Сэма Хайпмана👌

А вообще 2025 мне нравится всё больше, прорыв на прорыве👁
🔥4❤‍🔥1🤔1
Хм, DeepSeek дропнули новую визуальную модельку на hf

Пробуем тут https://huggingface.co/spaces/deepseek-ai/deepseek-vl2-small
Новые модели Google💥

Gemini 2.0 Pro Experimental (самая мощная) с 2 млн токенов!

Gemini 2.0 Flash Thinking Exp - мыслящая с 1 млн токенов! (в апке она с доступом к поиску, ютубу и картам)

Google наш слон🐘

Всё бесплатно юзаем в AI Studio по впн

Блгопост
🔥7👍2
норм 2.0 Pro может в стихи🌚
👍13😱5🔥4🗿3👎1🌚1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
Прогерам приготовиться! GitHub представил новый режим агента для Copilot в VS Code (может работать на o3-mini). Теперь AI-ассистент может не только помогать программистам, но и самостоятельно исправлять ошибки в коде, проводить юнит-тесты, предлагать терминальные команды и анализировать сбои во время выполнения программы. Режим агента способен распознавать дополнительные задачи, необходимые для реализации основного запроса, и выполнять их без участия человека👌

Обзорчик тут https://youtu.be/of--3Fq1M3w?si=JG3JX5JmbSOcA1zo
🔥9🙈4👎2
А вот это мощно 💥

Китай строит гигантский лазерный комплекс для термоядерного синтеза

Спутниковые снимки показывают масштабный X-образный объект под Мьянъяном (провинция Сычуань), который, по мнению аналитиков, может стать крупнейшим в мире лазерным комплексом для исследований термоядерного синтеза.

Цель проекта — получение чистой энергии путем слияния изотопов водорода под воздействием лазеров. Однако эксперты не исключают связь с разработкой ядерного оружия, так как установка позволяет моделировать условия ядерных взрывов. 

Комплекс, предположительно на 50% больше американского аналога NIF, где в 2022 году впервые достигли положительного энергобаланса, ускорил строительство после пандемии. Китай демонстрирует амбиции в «термоядерной гонке», что вызывает опасения Запада: без активных инвестиций США и их союзники могут уступить лидерство. 

Источник
10👍63🌚1🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Общение с ChatGPT через годик (или уже в этом🌚) будет выглядеть так:
😁8👻8😈4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, если сейчас с помощью шэрскрина новая Gemini 2.0 может делать работу радиолога (помогать ему), то что будет через годик - другой 🌚
11🔥52😱2
Просто прикольно - ai.com теперь перенаправляет на deepseek🌚 а год назад его за круглую сумму выкупал Сэм Альтман, а до этого принадлежал Gemini😁
😁15👀7🐳1
Интересное: тут специалисты из Microsoft Research, Лаборатории языковых технологий Кембриджского университета и Института автоматики Китайской академии наук разработали метод "Мультимодального визуального мышления" (MVoT), направленный на улучшение пространственного рассуждения в больших языковых моделях (LLM) и мультимодальных моделях (MLLM). MVoT позволяет моделям создавать изображения, отражающие их мыслительные процессы, что повышает точность в сложных задачах. Эксперименты показали, что MVoT эффективно справляется с динамическими пространственными задачами, превосходя традиционные цепочки рассуждений в сложных сценариях. Этот метод открывает новые возможности для решения задач, где визуальное мышление дополняет вербальное.

FEEL THE AGI👁
🔥9🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот как должен выглядеть настоящий ИИ-собеседник (а не просто окно чатика)🩶 зафайнтюнить Vector Robot можно по туториалам тут и тут
🔥10❤‍🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Luma.ai обновился и вроде неплохо так, ждём когда бесплатные конкуренты подятнутся 🌚
🔥6❤‍🔥4
Media is too big
VIEW IN TELEGRAM
Первый пошёл - 11и минутная ИИ-короткометражка по Звёздным Войнам смотрится не хуже последних фильмов от Диснея, даже бой на мечах кое как получился👌 Представляю, какие шедевры от настоящих фанов мы ещё посмотрим по пути к сингулярности 🌚

Спсиок ии-приблуд для создания в титрах, но понятно, что Google Veo2 тут основа, такое consistency пока что есть только у него. Звук, голос и музыка — всё тоже AI-generated

P.S.
К таким видео пока нужно относиться проще и смотреть на перспективу, ещё вчера создать такое в домашних условиях в одиночку за пару дней было невозможно, сегодня — это реально, а представьте, что будет возможно условно уже завтра
👍10💩5👀3🤔2🎃2🤩1
OpenAI (а точнее Сэм) анонсировал обновление дорожной карты для GPT-4.5 и GPT-5. Компания упрощает модельный ряд и убирает выбор модели, возвращаясь к «магическому» объединённому интеллекту. В ближайшие недели выйдет GPT-4.5 (Orion) — последняя модель без цепочки рассуждений. Позже GPT-5 станет универсальной системой, интегрирующей технологии o-серии, а o3 больше не будет доступен отдельно. Бесплатные пользователи получат неограниченный доступ к GPT-5 на стандартном уровне интеллекта, а подписчики Plus и Pro — доступ к более продвинутым версиям.

LETs Gooo💫
Чую DeepSeek R2 на подходе🌚
🌚9🔥6🤔2
YouTube интегрировал новую модель генерации видео Veo 2 от Google DeepMind. Теперь пользователи могут создавать уникальные AI-видеофоны или генерировать отдельные видеоклипы, которые можно добавлять в любые Shorts. Эти функции сейчас доступны в США, Канаде, Австралии и Новой Зеландии, с планами расширения на другие регионы в будущем. (кому нужно - юзайте VPN)


Чтобы включить Veo 2 в YouTube Shorts, откройте камеру Shorts, выберите «Зелёный экран», затем перейдите в Dream Screen и введите текстовый запрос для генерации видео.

Похоже началось..(хорошо что я шортсы не смотрю🌚)
😱10💩5
Хм, скажите Денису, чтобы Gemini 2.0 попробовал в AI Studio🌚

Вообще из всех нейронок самая человечная пока что на мой взгляд
😁14👍5💩3🔥2👎1💯1😐1