📄 PaddleOCR-VL (0.9B) — компактная Vision-Language модель нового поколения
Команда Baidu AI представила PaddleOCR-VL (0.9B) — сверхлёгкую VLM-модель, которая достигает SOTA-точности в задачах распознавания:
- текстов,
- таблиц,
- формул,
- графиков
💡 Под капотом:
- NaViT - динамический vision-энкодер
- ERNIE - облегчённая языковая модель от Baidu
⚡️ Поддержка 109 языков.
🟠 GitHub: https://github.com/PaddlePaddle/PaddleOCR)
🟠 HuggingFace: https://huggingface.co/PaddlePaddle/PaddleOCR-VL
🟠 Docs https://paddleocr.ai/latest/en/index.html
@ai_machinelearning_big_data
#BaiduAI #PaddlePaddle #Ernie #PaddleOCR #VisionLanguage #AI #OCR
Команда Baidu AI представила PaddleOCR-VL (0.9B) — сверхлёгкую VLM-модель, которая достигает SOTA-точности в задачах распознавания:
- текстов,
- таблиц,
- формул,
- графиков
💡 Под капотом:
- NaViT - динамический vision-энкодер
- ERNIE - облегчённая языковая модель от Baidu
@ai_machinelearning_big_data
#BaiduAI #PaddlePaddle #Ernie #PaddleOCR #VisionLanguage #AI #OCR
Please open Telegram to view this post
VIEW IN TELEGRAM
❤51🔥27👍16😁2💘1