374K subscribers
4.35K photos
826 videos
17 files
4.83K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🔥 Нейросети без цензуры: какие LLM ответят на любые вопросы

🟡 FuseChat-7B-VaRM. Хороший вариант для общения, без цензуры и ограничений. По сути, это три чат-бота, объединенных в один, каждый со своими особенностями. Это значит, что пользователь получает интересные беседы независимо от того, о чем хочет поговорить.

🟡 Chimera-Apex-7B. Создана для обычных разговоров и генерации не совсем обычных идей. Хороший приятель для мозгового штурма, который не боится быть немного диким. Все еще находится в стадии разработки, так что еще можно ждать сюрпризов.

🟡 Dolphin-2.8-experiment26-7b. Это тонкая настройка экспериментальной модели, которая зарекомендовала себя как лучшая с 7 млрд параметров. Это как усовершенствованная версия модели, в которой устранены все недостатки и оптимизирована производительность.

🟡 Nous-Hermes-2-Mistral-7B-DPO. Эта модель представляет собой значительное улучшение: она демонстрирует повышенную производительность в различных бенчмарках по сравнению со своими предшественниками. Особого внимания заслуживает ее применение в средах без цензуры. Сфокусирована на предоставлении качественных ответов, основанных на данных, что делает ее отличным кандидатом для тех, кто ищет продвинутые, неограниченные возможности LLM.

🟡 UNA-TheBeagle-7b-v1. Обучена на наборе данных The Bagel с использованием прямой оптимизации предпочтений (DPO) и UNA. Модель основана на нейро-чате Intel.

🟡 Nous Hermes 2 — SOLAR 10.7B. Новая модель от Nous Research, основанная на SOLAR 10.7B. Обучена на большом датасете, который состоит в основном из данных, сгенерированных GPT-4, и дополнительных ресурсов. По бенчмаркам почти достигла уровня производительности модели Yi-34B. Работает с системными промтами, что дает возможность пользователям определять правила, роли.

🟡 Dolphin 2.6 Mistral 7b — DPO Laser. Это языковая модель без цензуры, основанная на работе LASER. Благодаря более широкому контекстному окну в 16 тыс. токенов и таким передовым методам, как SVD и RMT, эта модель без цензуры выдает более надежные результаты, чем ее предшественники. Она идеальна для ролевых сценариев благодаря широкому диапазону ответов.

🟡 Dolphin-2.2.1-mistral-7b. Разработана Эриком Хартфордом и спонсируется a16z. Работает под лицензией Apache-2.0 и представляет собой универсальный инструмент как для коммерческих, так и для некоммерческих приложений. Одной из особенностей Dolphin-2.2.1-mistral-7b считается ее стремление к развитию содержательного общения. Набор данных был тщательно отфильтрован, чтобы устранить любую предвзятость, благодаря чему модель стала более послушной и может обеспечить нейтральный и открытый подход к генерации текста.

🟡 Zephyr 7B Alpha. Начальная итерация в серии больших языковых моделей Zephyr, известной своей емкостью в 7 млрд параметров. Эта версия mistralai/Mistral-7B-v0.1, усовершенствованной в процессе тонкой настройки с использованием комбинации общедоступных и синтетических наборов данных по методологии, известной как прямая оптимизация предпочтений (DPO).

🟡 Emerhyst-20B. Эта языковая модель без цензуры объединяет в себе сильные стороны двух популярных моделей, Amethyst 13B и Emerald 13B. Такой подход позволяет основной модели унаследовать лучшие черты от своих «родителей», создавая универсальный и эффективный генератор текстов. Для дальнейшего расширения возможностей Emerhyst-20B создатели использовали LimaRP v3, передовой инструмент для обучения больших языковых моделей.

Enjoy)

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25🔥94🥱1
⚡️ Graph Machine Learning

Бесплатный продвинутый курс: Машинное обучение на графах.

Курс регулярно дополняется практическими задачками и слайдами. Автор Ксавье Брессон - профессор национального университета Сингапура.

Введение

Погружение в графы
- Lab1: Generate LFR social networks
https://github.com/xbresson/GML2023/blob/main/codes/02_Graph_Science/code01.ipynb
- Lab2: Visualize spectrum of point cloud & grid
https://github.com/xbresson/GML2023/blob/main/codes/02_Graph_Science/code02.ipynb
- Lab3/4: Graph construction for two-moon & text documents
https://github.com/xbresson/GML2023/blob/main/codes/02_Graph_Science/code03.ipynb
https://github.com/xbresson/GML2023/blob/main/codes/02_Graph_Science/code04.ipynb

Кластеризация графов
- Lab1: k-means
https://github.com/xbresson/GML2023/blob/main/codes/03_Graph_Clustering/code01.ipynb
https://github.com/xbresson/GML2023/blob/main/codes/03_Graph_Clustering/code02.ipynb
- Lab2: Metis
https://github.com/xbresson/GML2023/blob/main/codes/03_Graph_Clustering/code03.ipynb
- Lab3/4: NCut/PCut
https://github.com/xbresson/GML2023/blob/main/codes/03_Graph_Clustering/code04.ipynb
https://github.com/xbresson/GML2023/blob/main/codes/03_Graph_Clustering/code05.ipynb
- Lab5: Louvain
https://github.com/xbresson/GML2023/blob/main/codes/03_Graph_Clustering/code06.ipynb https://pic.twitter.com/vSXCx364pe

Лекции 4 Graph SVM
- Lab1: Standard/Linear SVM
https://github.com/xbresson/GML2023/blob/main/codes/04_Graph_SVM/code01.ipynb
- Lab2: Soft-Margin SVM
https://github.com/xbresson/GML2023/blob/main/codes/04_Graph_SVM/code02.ipynb
- Lab3: Kernel/Non-Linear SVM
https://github.com/xbresson/GML2023/blob/main/codes/04_Graph_SVM/code03.ipynb
- Lab4: Graph SVM
https://github.com/xbresson/GML2023/blob/main/codes/04_Graph_SVM/code04.ipynb

Инструкции по запуску: https://sga.goldica.ir/b0dd72633a60ad0070e10de7b12c5322/xavierbresson/lectures/CS6208/running_notebooks.pdf

💡 Github

@ai_machinelearning_big_data
👍29🔥73
🦙 Файнтюниг Llama 3 с помощью ORPO.

Краткое руководство о том, как настроить новую модель Llama 3 8B с ORPO.

Надеюсь, вам понравится!

🤗 Модель: https://huggingface.co/mlabonne/OrpoLlama-3-8B
💻 Colab: https://colab.research.google.com/drive/1eHNWg9gnaXErdAa8_mcvjMupbSS6rDvi?usp=sharing
📝 Статья: https://huggingface.co/blog/mlabonne/orpo-llama-3

@ai_machinelearning_big_data
👍16🔥103
Студенты факультета компьютерных наук ВШЭ, основанного совместно с Яндексом, выиграли чемпионат мира по программированию ICPC.
Соревнования проходили в Египте, причем как для 2022, так и для 2023 года. Российские студенты заняли призовые места сразу в двух соревнованиях.
За 2023 год абсолютными чемпионами стала команда FFTilted (к слову, ребята с программы Прикладной математики и информатики, которую основал на факультете Яндекс). Ее участники — Фёдор Ромашов, Александр Бабин и Кирилл Кудряшов. За 2022 год команда Undertrained+Overpressured заняла третье место в абсолютном зачете. Ее представляли Максим Гороховский, Иван Сафонов и Тимофей Федосеев.
Команды показали лучший результат среди всех российских вузов. Всего в соревнованиях приняли участие команды из 170 университетов и 50 стран мира.
65🔥24👍19🥱6🤬5🤣2❤‍🔥1🗿1
🦾 🦏 Power of matplotlib

Вот такую красоту можно сделать с помощью matplotlib. Это визуализация гравюры немецкого художника Альбрехта Дюрера, изображающая индийского носорога, каким его представлял художник по доступным ему описаниям и рисункам в 1515.

Хотите научиться та к же: вот крутая бесплатная книга: "Научная визуализация: Python + Matplotlib"

Исходники книги c примерами кода лежат здесь.

Постер
Книга
Код из книги

@ai_machinelearning_big_data
39👍15🔥10🥰4
⚡️ Стартап Reka показал новую мультимодальную LLM Reka Core

🟡Стартап Reka, основанный бывшими разработчиками DeepMind, представил свою последнюю разработку в области искусственного интеллекта — мультимодальную языковую модель (LLM) под названием Reka Core. Эта передовая нейросеть способна обрабатывать текст, изображения, аудио и видео, чем выделяется среди других технологий в своем классе.

🟡Reka Core обладает впечатляющим контекстным окном на 128 000 токенов и поддерживает обработку данных на 32 языках, что делает её одной из самых мощных и универсальных систем на рынке. Эта функциональность открывает новые возможности для разработчиков и исследователей в области ИИ, позволяя модели эффективно справляться с задачами обработки больших объемов разнообразных данных.

🟡В ряде мультимодальных оценок Reka Core продемонстрировала результаты, превосходящие показатели таких известных моделей, как Claude 3 Opus и Gemini Ultra. Особенно заметно это стало в области обработки видеоконтента, где Reka Core вышла на первое место, превзойдя Gemini Ultra. Кроме того, модель показала конкурентоспособные результаты с GPT-4 в задачах по пониманию изображений, что свидетельствует о высоком качестве и универсальности разработки.

🟡Компания Reka активно сотрудничает с такими гигантами, как Oracle и Snowflake, что позволяет ей расширять свои возможности и укреплять позиции на рынке.

▶️ Сайт Reka.ai (можно сразу открыть чат)

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30🔥127
📌Intel представила нейроморфный компьютер Hala Point — «искусственный мозг» с 1,15 млрд нейронов

🟡Компания Intel создала самый большой в мире нейроморфный компьютер под названием Hala Point. Это революционное устройство, предназначенное для имитации деятельности человеческого мозга. Производитель утверждает, что новинка в 50 раз превосходит любые аналогичные вычислительные системы, но при этом потребляет в 100 раз меньше энергии.

🟡Устройство построено на базе 1152 чипов Loihi 2 с 140 544 вычислительными ядрами и содержит в себе 1,15 млрд «искусственных нейронов», способных выполнять до 380 трлн синаптических операций в секунду. Еще в состав Hala Point включены 2300 упрощенных x86-процессоров, предназначенных для выполнения вспомогательных операций.

🟡При этом общая пропускная способность памяти устройства достигает значения в 16 ПБ/с. Все это помещено в довольно компактный корпус, напоминающий по размерам микроволновую печь. Потребление устройства составляет 2600 Вт. По словам разработчиков, их система является кремниевым аналогом мозга совы.

🟡Hala Point способна достигать впечатляющей вычислительной эффективности, превышающей 20 квадриллионов 8-битных операций в секунду при развертывании глубоких нейросетей. Стоит отметить, что данная система существует в виде прототипа, а Intel пока не планирует отправлять ее в массовое производство. Единственный экземпляр Hala Point находится в Сандийских национальных лабораториях в США. Местные ученые будут использовать его для исследований в области нейронных сетей.

📎 Подробнее

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34🔥1561😁1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥🎮 Video2Game: Real-time, Interactive, Realistic and Browser-Compatible Environment from a Single Video

Video2Game - фреймворк, который позволяет преобразовывать видео в реалистичную и интерактивную игровую среду!

В основе модели лежат ри основных компонента: (i) NeRF, который отображает геометрию и пространство сцены; (ii) mesh модуль, который использует NeRF для ускорения рендеринга; и (iii) физический модуль, который моделирует физическую динамику и взаимодействие объектов.

Встроенные агенты могут свободно перемещаются по местности в виртуальной среде, где их действия соответствуют физике реального мира. Игроки могут взаимодействовать с объектами на сцене, подчиняясь физическими законами.

Project page: https://video2game.github.io
Code: https://github.com/video2game/video2game
Demo: https://video2game.github.io/src/garden/index.html

@ai_machinelearning_big_data
🔥24👍94
🌟 Рост популярности Anthropic Claude: вызовы и перспективы для OpenAI

🟡В последнее время наблюдается значительный рост популярности платформы Anthropic Claude. Согласно данным SimilarWeb, посещаемость этой платформы значительно возросла за последние месяцы.
В то время как Anthropic Claude продолжает завоевывать пользователей, платформа ChatGPT от OpenAI испытывает снижение по трафику уже почти год. Сравнение данных показывает, что Claude обгоняет не только ChatGPT, но и других конкурентов.

🟡Одной из причин успеха Claude может быть недавний запуск 3 поколения разработки Anthropic, что, по мнению некоторых аналитиков, придало платформе значительное преимущество.

🟡Anthropic Claude 3 поколения является последней разработкой компании Anthropic в области искусственного интеллекта. Этот инструмент представляет собой мощную платформу, способную генерировать тексты, отвечать на вопросы и взаимодействовать с пользователями на уровне, близком к человеческому.

🟡Одной из ключевых причин, почему Anthropic Claude 3 поколения представляет угрозу для ChatGPT, является его улучшенная способность понимания контекста и генерации более качественных ответов. Claude обладает более развитой моделью понимания языка и обучен на более обширном корпусе текстов, что позволяет ему создавать более информативные и связные ответы на запросы пользователей.

📎 Исследование о популяризации Claude от SimilarWeb

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍8🔥4😁1
🔎 Moving Object Segmentation:All You Need Is SAM (and Flow)

SAM + Optical Flow = FlowSAM

FlowSAM - новый инструмент для обнаружения и сегментации движущихся объектов на видео, который значительно превосходит все предыдущие модели, как для одного объекта, так и для множества объектов 🔥

Project page: https://www.robots.ox.ac.uk/~vgg/research/flowsam/
Code: https://github.com/Jyxarthur/flowsam
Paper: https://arxiv.org/abs/2404.12389
Data: https://drive.google.com/drive/folders/1tmDq_vG_BvY5po40Ux5OBds1avUM_CbR

@ai_machinelearning_big_data
👍28🔥76
⚡️ AI Safety — бенчмарк для оценки безопасности AI

Некоммерческий проект MLCommons, занимающийся созданием и поддержкой бенчмарков, широко используемых в ИИ-индустрии, анонсировал новую разработку. Речь идёт об инструменте — AI Safety v0.5, позволяющем оценивать безопасность ИИ-систем.

AI Safety v0.5 находится на стадии proof-of-concept и позволяет оценивать большие языковые модели (LLM), стоящие за современными чат-ботами, анализируя ответы на запросы из «опасных категорий». Необходимость в появлении такого инструмента давно назрела, поскольку технологию оказалось довольно легко использовать в неблаговидных и даже опасных целях. Например, можно применять для подготовки фишинговых атак и совершения других киберпреступлений, а также для распространения дезинформации и разжигания ненависти.

Хотя измерить безопасность довольно сложно с учётом того, что ИИ используется в самых разных целях, в MLCommons создали инструмент, способный разбираться с широким спектром угроз. Например, он может оценивать, как бот отвечает на запрос о рецептах изготовления бомбы, что отвечать полиции, если пойман за созданием взрывного устройства и т.п. Каждая модель «допрашивается» серией тестовых запросов, ответы на которые потом подлежат проверке. LLM оценивается как по каждой из категорий угроз, так и по уровню безопасности в целом.

Бенчмарк включает более 43 тыс. промтов. Методика позволяет классифицировать угрозы, конвертируя ответы в понятные даже непрофессионалам характеристики, вроде «высокий риск», «умеренно-высокий риск» и т.д. При этом представители организации заявляют, что LLM чрезвычайно трудно оценивать по ряду причин.

Бенчмарк AI Safety v0.5 уже доступен для экспериментов и организация надеется, что исходные тесты сообществом позволят выпустить усовершенствованную версию v1.0 позже в этом году. Платформа открыта для предложений новых тестов и интерпретации результатов.

▶️ Страничка проекта

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍123🔥2🤔2👌1
⚡️ Поисковик Brave научился отвечать на вопросы с помощью ИИ

Ориентированная на конфиденциальность поисковая система Brave расширила функциональность своей системы ответов на запросы пользователей с помощью ИИ.

Теперь при вводе запроса в Brave в поле выдачи сперва отображается выжимка от AI с ссылками на источники, и только потом сайты.
Выглядит наподобие Perplexity и Phind.

▶️ Пробуйте)

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍224🔥4🤬2🌭1
🪄👕 Magic Clothing: controllable garment-driven image synthesis

Вышла модель Waifu Dress Up 2024!

Magic Clothing позволяет создавать персонажей, одетых в заданную одежду, на основе промпта и входного изображения.

git clone https://github.com/ShineChen1024/MagicClothing.git

Github
Paper

@ai_machinelearning_big_data
👍16🔥73🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 AI Image Generator: Create images from text.

Новое поколение
#Photoshop уже здесь.

Adobe добавили ИИ-инструменты в Photoshop на базе новой модели Firefly Image 3. Модель может самостоятельно подобрать или изменить фон, сгенерировать похожие изображения, генерировать изображения из промптов.

Полный список обновлений здесь.

Blog
Demo

@ai_machinelearning_big_data
👍13🔥76❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️🗣 OpenVoice V2 - a Text-to-Speech model that can clone any voice and speak in any language.

OpenVoice V2 - новая версия открытой модели преобразования текста в речь, которая позволяет клонировать любой голос и генерировать речь на различных языках.

Github: https://github.com/myshell-ai/OpenVoice/tree/main
Usage: https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md

@ai_machinelearning_big_data
👍25🔥85
🍏 OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework by Apple

Сегодня Apple выпустили Openly.

- Новое семейство LM с открытым исходным кодом для обучения моделей и логического вывода
- Работает наравне с OLMo, но требует в 2 раза меньше токенов для обучения
- Модели для различных задач, включая базовые модели (например, CLIP и LLM), классификацию объектов, обнаружение объектов и семантическую сегментацию.

Cписок моделей и подробная информации о каждой из них:

- OpenELM-270M
- OpenELM-450M
- OpenELM-1_1B
- OpenELM-3B
- OpenELM-270M-Instruct
- OpenELM-450M-Instruct
- OpenELM-1_1B-Instruct
- OpenELM-3B-Instruct

gitHub: https://github.com/apple/corenet
hf: https://huggingface.co/apple/OpenELM
abs: https://arxiv.org/abs/2404.14619

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍113