微软发布全新 AI 多模态基座模型 Magma
时间:2025-02-21 10:11 来源:未知 作者:IT
微软研究院、马里兰大学、威斯康星大学麦迪逊分校 KAIST 和华盛顿大学的研究人员宣布推出多模态基础大模型 Magma。
-
GitHub 地址:https://github.com/microsoft/Magma
-
论文地址:https://www.arxiv.org/pdf/2502.13130

Magma 采用了深度学习架构和大规模预训练相结合的方法,以优化其在多个领域的性能。该模型使用 ConvNeXt-XXL 视觉骨干处理图像和视频,同时使用 LLaMA-3-8B 语言模型处理文本输入。

Magma 的设计旨在克服现有 VLA 模型的不足,它采用了一种强大的训练方法,将多模态理解、行动基础和规划融为一体。Magma 采用包含 3,900 万个样本的多样化数据集进行训练,其中包括图像、视频和机器人动作轨迹。
(责任编辑:IT)
微软研究院、马里兰大学、威斯康星大学麦迪逊分校 KAIST 和华盛顿大学的研究人员宣布推出多模态基础大模型 Magma。
Magma 的设计旨在克服现有 VLA 模型的不足,它采用了一种强大的训练方法,将多模态理解、行动基础和规划融为一体。Magma 采用包含 3,900 万个样本的多样化数据集进行训练,其中包括图像、视频和机器人动作轨迹。 (责任编辑:IT) |