具身智能与大模型融合创新技术实训研讨会成功举办

2025年1月16日-19日武汉，AI未来标杆联合北京博创鑫鑫教育科技，举行“具身智能与大模型融合创新技术”实训研讨会，本次会议面向高校AI教师和企业AI工程师群体，通过3天的技术研修和实操教学，通过将 AI 大模型与具备3D视觉的机器人相结合，为学员实践演示，带领学员深入理解通用具身智能的原理和应用。本实训围绕「多模态输入->感知与理解->行动执行->反馈学习」的闭环过程展开。通过多模态数据的融合（包括听觉、视觉、触觉等），并结合大语言模型和深度学习算法，带领学员实现了对自然语言指令的理解、物体识别和抓取、路径规划以及任务执行的完整流程。

参会对象

各高等院校大数据、人工智能、计算机科学技术、自动化、机器人工程、机电控制工程、电子信息工程、通信工程、网络工程、物联网工程、软件工程和信息工程相关专业的教师、教学带头人、教学科研管理人员；以及信息系统与管理、应用数学专业、经济管理、统计学等相关专业的教师、教学科研管理人员；从事计算机视觉、智能体、多模态、大模型科研工作的硕士生、博士生等科研人员；各高校教务处、科研处、信息中心、实验中心教科研人员和管理人员等；企业从事具身智能、大模型、人工智能相关的技术人员和管理人员等。

配套文档

一、硬件环境

3D 相机（实验所用 Gemini2 相机）

机械臂

二、软件环境

Ubuntu20.04 或 Win10

Python3.8 以上

https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

Anaconda3 5.3（64-bit）

OpenCV-python4.8

Pytorch2.2.1

Jupyter notebook7.0.7

智能体Agent大语言模型：Yi-Large、Claude 3 Opus、

文心大模型 4.0 Turbo

多模态视觉理解大模型：GPT4v、GPT4o、Yi-Vision、

Claude 3 Opus、智谱 CogVLM2-Grounding、通义千问 Qwen-VL-Max