📎 Открытые датасеты 📎
🔵  Labelled Faces in the Wild. 13 тысяч размеченных изображений лиц.
🔵  IMF Data. Датасеты о финансах и ценах на товары.
🔵  Google Trends. Данные о поисковой статистике и трендовых запросах.
🔵  xView. Большой набор воздушных снимков Земли с аннотациями.
🔵  World Bank Open Data. Наборы данных о демографии и экономических показателях.
🔵  Labelme. Большой датасет с уже размеченными изображениями.
🔵  HotspotQA Dataset . Датасет с вопросами-ответами для генерации ответов на часто задаваемые простые вопросы.
🔵  Berkeley DeepDrive BDD100k. Тысячи часов вождения для обучения автопилотов.
🔵  MIMIC-III. Обезличенные медицинские данные пациентов.
🔵  CREMA-D — датасет для распознавания эмоций по записи голоса.
@data_analysis_ml
@data_analysis_ml
Please open Telegram to view this post
    VIEW IN TELEGRAM
  👍22🔥3❤2
  TrustLLM — инструмент на Python для комплексного исследования ответов от LLM.
TrustLLM рассматривает 6 аспектов ответов: правдивость, безопасность, этичность, соблюдение конфиденциальности и другие.
В этом документе подробно объясняется, как использовать инструмент для оценки эффективности собственных моделей.
pip install trustllm
▪GitHub
▪Arxiv
▪Docs
▪Project
#llm
TrustLLM — инструмент на Python для комплексного исследования ответов от LLM.
TrustLLM рассматривает 6 аспектов ответов: правдивость, безопасность, этичность, соблюдение конфиденциальности и другие.
В этом документе подробно объясняется, как использовать инструмент для оценки эффективности собственных моделей.
pip install trustllm
▪GitHub
▪Arxiv
▪Docs
▪Project
#llm
Please open Telegram to view this post
    VIEW IN TELEGRAM
  Please open Telegram to view this post
    VIEW IN TELEGRAM
  👍11❤8🔥3
  Синтетический набор данных, содержащий более 22 млн цепочек рассуждений для прометав общего назначения в различных областях.
Большой датасет, содержащих следы рассуждений для различных тем: связанных с кодом/математикой, социальных сферах и естественных наук и тд.
https://huggingface.co/datasets/glaiveai/reasoning-v1-20m
#dataset #Reasoning
Please open Telegram to view this post
    VIEW IN TELEGRAM
  👍13🔥4❤3
  Forwarded from Machinelearning
QWEN только что выпустили новую модель на 32B параметров, Qwen2.5-VL-32B-Instruct.
Эта модель представляет собой значительный прогресс для своего размера. И что самое лучшее, она лицензирована Apache 2.
Модель выдает более подробные и структурированный ответы.
💡 Детальное понимание: превосходные возможности анализа изображений и визуальной логической дедукции.
📊 Превосходит сопоставимые модели, такие как Mistral-Small-3.1-24B и Gemma-3-27B-IT.
🚀 В нескольких тестах даже превосходит более крупный Qwen2-VL-72B-Instruct.
Еще один крутой релиз понедельника!
ВЧ: https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct
@ai_machinelearning_big_data
#AI #ML #LLM #Dataset #HuggingFace
Please open Telegram to view this post
    VIEW IN TELEGRAM
  👍11🔥6❤4
  