Machinelearning

⚡️ Ling-flash-2.0 теперь в открытом доступе! ⚡️

Модель 100 B параметров, но задействовано всего ≈6.1B активных, что делает модель очень экономной.

🚀 Чем хороша Ling-flash-2.0
- Обучена на более чем 20 триллионах токенов с до-обучением и RL-этапами.
- Демонстрирует state-of-the-art производительность среди плотных моделей до 40B параметров.
- Особенно хороша в сложном рассуждении, генерации кода и задачах с фронтендом.

⚙️ Архитектура и эффективность
- MoE-архитектура с активированием лишь части параметров (activation ratio 1/32).
- Много технических фишек: продвинутое распределение экспертов, баланс внимания, схема маршрутизации без вспомогательных потерь и др.
- На железе H20 модель генерирует 200+ токенов в секунду - в 3× быстрее по сравнению с плотной моделью 36B.
- Поддерживает контексты до 128K токенов (с YaRN).

https://huggingface.co/inclusionAI/Ling-flash-2.0

@ai_machinelearning_big_data

#moe #llm #ml #ai #opensource

👍323❤49👏26🔥21🎉16😁10🤩8🥰7😢5😍5🏆5

27.9K views15:23

Machinelearning

🚀

SakanaAI представил Robust Agentic CUDA Kernel Optimization

Это новый подход, где LLM помогает оптимизировать CUDA-ядра для PyTorch.

• Слияние операций ускоряет forward/backward-проходы, результаты выше стандартных Torch-базлайнов
• Полный пайплайн: PyTorch → генерация CUDA-кода → эволюционная оптимизация во время работы
• Проверка через LLM: модели автоматически отмечают неправильные ядра (дает +30% к производительности)
• robust-kbench — собственный бенчмарк, где измеряют не только скорость, но и корректность работы LLM

Авторы пишут о 2.5x ускорении над PyTorch eager и даже 6x в линейных операциях

❗️

Но большинство примеров — это тесты на слияние операций с неотюненной базой, так что цифры спорные.

К тому же PyTorch 2.5 уже внедряет похожие оптимизации ), поэтому такие рекорды могут быстро обесцениться.

Это интересный подход к самообучающимся AI-компиляторам, но заявленные ускорения стоит проверять на праактике.

🟢

Github: https://github.com/SakanaAI/robust-kbench

🟢

Статья: https://arxiv.org/abs/2509.14279

@ai_machinelearning_big_data

#AI #CUDA #PyTorch #SakanaAI #LLM #Optimizatio

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍138🤔104❤24🔥16🤩12🎉10👏5😢4💘1😎1

24.2K views09:09

About

Blog

Apps

Platform