全息人工智能-Ceacer网络

文章分享首个三维具身通才智能体LEO：全面掌握感知、推理、规划、行动

12月8日消息:近年来，多模态大语言模型在自然语言处理、视觉理解和机器人领域取得了显著进展。然而，这些模型主要基于二维图片和文本数据，对于理解和交互于三维世界的任务存在一定的欠缺。为解决这一问题，北京通用人工智能研究院携手北京大学、卡耐基梅隆大学和清华大学的研究人员，提出了具备感知、推理、规划、行动等多任务多模态能力的首个三维世界具身通...

日期：2023-12-08 栏目：文章分享阅读：17243

文章分享 首个三维具身通才智能体LEO：全面掌握感知、推理、规划、行动

文章分享首个三维具身通才智能体LEO：全面掌握感知、推理、规划、行动