Forwarded from Machinelearning
MASi3R-SLAM - проект, который умеет строить детальные 3D-карты окружающей среды и отслеживать движение камеры в реальном времени без предварительной калибровки. Система работает даже с изменяющимися во аремени параметрами, например, при зумировании или оптических искажениях.
Основа MASi3R-SLAM - алгоритм, использующий модели DUSi3R и MASi3R для восстановления геометрии сцены по 2 изображениям. DUSi3R анализирует пары изображений, предсказывая детальные карты 3D-точек в общей системе координат, а MASi3R дополнительно генерирует дескрипторы для каждого пикселя, повышая точность сопоставления даже при большом смещении кадров.
Полученные данные от моделей обрабатывает уникальный алгоритм, который анализирует «карты точек», прогнозируемые нейросетью, и находит соответствия между кадрами за 2 миллисекунды, что в 40 раз быстрее аналогов.
В тестировании на наборах TUM RGB-D и EuRoC, показали: MASi3R-SLAM превосходит DROID-SLAM и другие системы по точности траектории (средняя ошибка — 3 см) и детальности 3D-моделей.
На сегодняшний день основное ограничение MASi3R-SLAM — скорость декодера из-за его вычислительной нагрузки: полный цикл обработки одного ключевого кадра занимает в среднем 26–27 миллисекунд, что примерно 64% общего времени работы паплайна.
Например, при разрешении 512 пикселей по длинной стороне декодер MASi3R тратит до 2 секунд на глобальный поиск соответствий, тогда как алгоритм сопоставления сокращает это время до 2 мс. На выходе создается «бутылочное горлышко», которое ограничивает частоту кадров до 15 FPS.
⚠️ Перед установкой необходимо загрузить модели и установить версию Pytorch, соответствующую установленной версии CUDA.
# Create Conda env
conda create -n mast3r-slam python=3.11
conda activate mast3r-slam
# Clone Repo
git clone https://github.com/rmurai0610/MASt3R-SLAM.git --recursive
cd MASt3R-SLAM/
# Install dependencies
pip install -e thirdparty/mast3r
pip install -e thirdparty/in3d
pip install --no-build-isolation -e .
# Launch Live demo with camera
python main.py --dataset realsense --config config/base.yaml
# Or running on a MP4 video
python main.py --dataset <path/to/video>.mp4 --config config/base.yaml
python main.py --dataset <path/to/folder> --config config/base.yaml
@ai_machinelearning_big_data
#AI #ML #CV #3D #SLAM #Robotics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2🔥1
🧱 Что если собирать 3D-модели так же легко, как конструктор LEGO?
Давно у нас не было интересных моделей для генерации 3D-объектов, как раз вышла новая SOTA - OmniPart.
Вместо того чтобы генерировать объект целиком (и надеяться, что он не выйдет «слипшимся»), OmniPart:
1. ПОзвоялет задавать структуру - где будут ножки у стула, спинка, подлокотники и т.д.
2. Затем модель генерирует каждую часть отдельно, но с учётом общей формы и стиля.
3. Собирает всё в единый, согласованный 3D-объект.
🔹 Моделька поддерживает кастомные макеты можно задаёте, задавать различные части и где должны быть.
🔹 Даёт точный контроль над каждой деталью (цвет, форма, материал).
🔹 Показывает лучшее в классе качество (SOTA) за счёт семантического разделения и структурной е.
📚 Детали
• Статья: arXiv:2507.06165
• Проект: omnipart.github.io
• Код: github.com/HKU-MMLab/OmniPart
• Демо: Hugging Face Spaces
#3D #генеративныйИИ #компьютерноезрение #OmniPart #искусственныйинтеллект
Давно у нас не было интересных моделей для генерации 3D-объектов, как раз вышла новая SOTA - OmniPart.
Вместо того чтобы генерировать объект целиком (и надеяться, что он не выйдет «слипшимся»), OmniPart:
1. ПОзвоялет задавать структуру - где будут ножки у стула, спинка, подлокотники и т.д.
2. Затем модель генерирует каждую часть отдельно, но с учётом общей формы и стиля.
3. Собирает всё в единый, согласованный 3D-объект.
🔹 Моделька поддерживает кастомные макеты можно задаёте, задавать различные части и где должны быть.
🔹 Даёт точный контроль над каждой деталью (цвет, форма, материал).
🔹 Показывает лучшее в классе качество (SOTA) за счёт семантического разделения и структурной е.
📚 Детали
• Статья: arXiv:2507.06165
• Проект: omnipart.github.io
• Код: github.com/HKU-MMLab/OmniPart
• Демо: Hugging Face Spaces
#3D #генеративныйИИ #компьютерноезрение #OmniPart #искусственныйинтеллект
❤14👍5🥰3