首个三维具身通才智能体LEO:全面掌握感知、推理、规划、行动

首个三维具身通才智能体LEO:全面掌握感知、推理、规划、行动

12月8日 消息:近年来,多模态大语言模型在自然语言处理、视觉理解和机器人领域取得了显著进展。然而,这些模型主要基于二维图片和文本数据,对于理解和交互于三维世界的任务存在一定的欠缺。为解决这一问题,北京通用人工智能研究院携手北京大学、卡耐基梅隆大学和清华大学的研究人员,提出了具备感知、推理、规划、行动等多任务多模态能力的首个三维世界具身通...
日期: 栏目:文章分享 阅读:17114