374K subscribers
4.35K photos
824 videos
17 files
4.83K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🔥 Wunjo AI — open-source проект позволяющий создавать дипфейки и не только

Помимо создания дипфейков этот проект с открытым исходным кодом может клонировать речь, генерировать видео, удалять текст и объекты, а также получать изображения без фона, прямо на вашем компьютере.
Wunjo AI — это локальное приложение, которое работает даже на слабых компьютерах, предоставляя вам возможности по созданию контента любой длительности.

📎 Описание Wunjo AI от автора
📎 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍12🔥9😁2🍌2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Text Generation Inference v2.0.0  —   готовый сервер для инференса LLM, написанный на Rust, Python и gRPC.

Инференс ML-модели - это процесс её работы на конечном устройстве. Поэтому, чем больше мы разгоняем инференс, тем быстрее работает модель.

В новую версию Text Generation Inference добавлена поддержка модели Command R+.

TGI - самый быстрый сервер с открытым исходным кодом для Command R+

Используя возможности Medusa heads, на тестах достигается беспрецедентная скорость с задержкой всего в 9 мс на токен для модели 104B!

ПОддерживает популярные Lms с открытым исходным кодомД Llama, Falcon, StarCoder, BLOOM, GPT-NeoX и другие.

Github
Установка

@ai_machinelearning_big_data
👍62🔥85🍌1
🔥 Создание 3D-моделей из плоской картинки с помощью DUSt3R

Встречайте DUSt3R — новый подход геометрического конструирования 3D на основе 2D (Dense and Unconstrained Stereo 3D Reconstruction).
DUSt3R не требует калибровки камеры или данных о точке обзора.

Ключевые возможности DUSt3R:
🟡Работает с произвольными коллекциями изображений

🟡Интеграция монокулярных и бинокулярных методов реконструкции с помощью регрессии точечных карт

🟡Выравнивает многоракурсные карты точек в общую систему координат

🟡Использует кодеры/декодеры с предварительно обученными моделями

🖥 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥123👏3
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ В Google Workspace появился ИИ-видеоредактор

В Google Workspace (который содержит приложения типа Docs, Sheets и Slides) появился новый сервис — онлайн видеоредактор Vids.

Это довольно простое приложение для создания видео, предназначенное для бизнеса.
Вы можете использовать его для создания видеопрезентаций с временной шкалой, в которые можно быстро накидать картинки со своего Google Диска.

Вы также можете добавить закадровый голос или видеозапись своей речи, чтобы добавить привлекательности.

Однако что делает Vids действительно интересным, так это то, что он использует ИИ Gemini.

Пользователи могут попросить Gemini писать сценарии, создавать раскадровки и даже озвучивать видео.

Он также может использовать библиотеку видеоматериалов и даже самостоятельно создавать изображения.
Vids в настоящее время тестируется небольшим количеством пользователей Workspace.

📎 Introducing Google Vids

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥107❤‍🔥2🤬1
📓Free book: "Build an LLM from Scratch"

Один из лучших способов разобраться в LLM - это написать ее с нуля!

Сегодня вышла новая глава книги - "Chapter 5: Pretraining on Unlabeled Data".

Автор книги - Себастьян Рашка, известный Исследователь, популяризатор машинного обучения и автор книг по Deep Learning.

В этой главе рассматриваются:
- Оценка качества текста, сгенерированного LLM во время обучения
- Реализация функции обучения и настройка LLM
- Сохранение и загрузка весов для обучения LLM
- Загрузка предварительно подготовленных весов из OpenAI

Github

@ai_machinelearning_big_data
👍34🔥156
HairFastGAN: Realistic and Robust Hair Transfer with a Fast Encoder-Based Approach

Новая модель для переноса прически с эталонного изображения на исходную фотографию для виртуальной примерочной.

Paper: https://arxiv.org/abs/2404.01094
Code: https://github.com/AIRI-Institute/HairFastGAN
Colab: https://colab.research.google.com/#fileId=https%3A//huggingface.co/AIRI-Institute/HairFastGAN/blob/main/notebooks/HairFast_inference.ipynb

@ai_machinelearning_big_data
👍30🔥72🤷‍♀1
🖥 GitHub Copilot в CLI теперь общедоступен (вышел из беты)

Относительно недавно GitHub Copilot объявил об общедоступности своего расширения интерфейса командной строки (CLI). Это обновление расширяет функциональность Copilot на терминал, позволяя пользователям получать выгоду от его функций непосредственно в рабочем процессе.

Новые функции Copilot CLI:
Теперь Copilot может предлагать команды на основе пользовательского ввода, а также выполнять эти команды

Помимо предложений на основе пользовательского ввода, Copilot будет предоставлять пояснения к существующим командам

Новые вспомогательные псевдонимы доступны для оболочек Bash, PowerShell и Zsh. Эти псевдонимы, созданные командой gh copilot alias, предоставляют сокращения для часто используемых функций Copilot:
ghcs – выполняет предложенные команды
ghce — объясняет существующие команды

📎 Подробнее

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
19👍13🔥9😨1
⚡️ GitHub — mshumer/gpt-llm-trainer

• Цель gpt-llm-trainer — упростить процесс обучения модели.

• Система сгенерирует набор данных с нуля и настроит модель LLaMA 2 или GPT-3.5 для пользователя. Генерация набора данных осуществляется с использованием Claude 3 или GPT-4.

• После генерации набора данных система автоматически разделит его на обучающий и проверочный наборы и настроит модель.

• Для использования системы необходимо написать промпт и задать температуру и количество примеров для генерации.

• Обученная модель может быть протестирована с использованием ячеек логического вывода или сохранена на Google Диск.

🖥 GitHub 3.8k⭐️

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥94
⚡️ Stability AI расширила доступ к тестированию Stable Diffusion третьего поколения

Следующее поколение генерирующей изображения по текстовой подсказке ИИ-модели Stable Diffusion пока не запущено публично, но уже доступно некоторым разработчикам через API и новую платформу для создания контента, а также платформу для разработчиков. Для организации доступа к ИИ по API Stability AI объединила усилия с API-платформой Fireworks AI.

По словам разработчиков, новое поколение Stable Diffusion «не уступает, либо превосходит» другие подобные модели, вроде DALL-E 3 от OpenAI и Midjourney «в понимании и соблюдении запросов». Stable Diffusion 3 использует архитектуру Multimodal Diffusion Transformer, которая должна улучшить понимание текста и орфографии.

Новая платформа для создания контента Stable Assistant Beta — это «дружелюбный чат-бот», позволяющий платным подписчикам работать с передовыми ИИ-моделями Stability AI, генерировать изображения и писать тексты. Пока платформа находится в стадии закрытого тестирования ограниченной группой пользователей и недоступна для широкой публики. В очередной раз расширив доступность своих продуктов, компания подчеркнула, что «принимает разумные меры для предотвращения неправомерного использования Stable Diffusion 3 злоумышленниками».

📎 Подробнее

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍206🔥6🌭1
🌟 Не разрешают использовать ChatGPT — разворачивам LLM локально

Бывают ситуации, когда жизненные обстоятельства не позволяют использовать ChatGPT и приходится разворачивать LLM локально.
Что в этом случае можно использовать?

1. Проприетарные модели:
🟡 Anthropic – в настоящее время сравним или превосходит по качеству ChatGPT 4.0 на некоторых задачах и обладает большим контекстным окном, давая возможность решать многие задачи, не прибегая к RAG и другим гибридным методам

🟡 Yandex GPT – хорошо функционирует на русском языке, поэтому если ваша бабушка еще и майор – она точно оценит этот вариант

🟡 GigaChat – модель от Сбера, так же хорошо работает на русском и смотри пункт выше

2. Открытые модели:
🟡 LLama 2 – оригинальная открытая модель от известной террористической организации, на базе которой уже нагородили over 100500 разных моделей, за что этой организации большое спасибо (до сих пор никто не понимает, что подвигло Марка на данное решение). По качеству не дотягивает до ChatGPT 4.

🟡 ruGPT – претрейн от GigaChat под лицензией MIT, Сбер приложил руку и тут, спасибо им. Можно использовать

🟡 Mistral – модель, разработанная выходцами из Гугла во Франции. Качество не дотягивает до ChatGPT 4, но в среднем лучше, чем Llama 2.

🟡 Falcon – модель разработана на арабские деньги европейцами. В целом, послабее Llama 2, и смысл ее использования от меня ускользает.

🟡 Grok от X – предположительно "based" модель от самого Илона. Работает пока так себе, плюс-минус на уровне ChatGPT 3.5, но Илон обещает порвать всех на тряпки и есть причины ему верить.

Оценки моделей на текущий момент выглядят примерно так (на изображении)

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
25👍22😁6🥱3❤‍🔥2🔥1🥰1🤷1
⚡️ 💻 AutoCodeRover: Autonomous Program Improvement

AutoCodeRover - это полностью автоматизированный инструмент для исправления ошибок на GitHub (исправление ошибок в разделе issues и генерации новых функций в проект).

AutoCodeRover работает в два этапа:

🔎 Поиск контекста: LLM анализирует код для собирает контекст.
💊 Генерация исправлений: LLM переписывает код на основе полученного контекста.

AutoCodeRover уже решает ~16% ошибок на датасете SWE-bench и ~22% ошибок SWE-bench lite и продолжает совершенствоваться.

Github
Paper

@ai_machinelearning_big_data
👍18🔥42😎1
This media is not supported in your browser
VIEW IN TELEGRAM
👑Llama 3 is here, with a brand new tokenizer! 🦙

Вышла Llama 3


Сегодня вышла новая SOTA Llama 3 в двух версиях на 8B и 70B параметров.

Длина контекста 8К, поддержка 30 языков.

HF: https://huggingface.co/spaces/ysharma/Chat_with_Meta_llama3_8b
Blog: https://ai.meta.com/blog/meta-llama-3/

Вы можете потестить 🦙 MetaLlama 3 70B и 🦙 Meta Llama 3 8B с помощью 🔥 бесплатного интерфейса: https://llama3.replicate.dev/

P.S. В процессе обучения находится модель на 400В+ параметров.

@ai_machinelearning_big_data
👍26🔥125🥱1