2025年1月16日-19日武汉,AI未来标杆联合北京博创鑫鑫教育科技,举行“具身智能与大模型融合创新技术”实训研讨会,本次会议面向高校AI教师和企业AI工程师群体,通过3天的技术研修和实操教学,通过将 AI 大模型与具备3D视觉的机器人相结合,为学员实践演示,带领学员深入理解通用具身智能的原理和应用。本实训围绕「多模态输入->感知与理解->行动执行->反馈学习」的闭环过程展开。通过多模态数据的融合(包括听觉、视觉、触觉等),并结合大语言模型和深度学习算法,带领学员实现了对自然语言指令的理解、物体识别和抓取、路径规划以及任务执行的完整流程。


参会对象
各高等院校大数据、人工智能、计算机科学技术、自动化、机器人工程、机电控制工程、电子信息工程、通信工程、网络工程、物联网工程、软件工程和信息工程相关专业的教师、教学带头人、教学科研管理人员;以及信息系统与管理、应用数学专业、经济管理、统计学等相关专业的教师、教学科研管理人员;从事计算机视觉、智能体、多模态、大模型科研工作的硕士生、博士生等科研人员;各高校教务处、科研处、信息中心、实验中心教科研人员和管理人员等;企业从事具身智能、大模型、人工智能相关的技术人员和管理人员等。
配套文档
一、硬件环境
3D 相机(实验所用 Gemini2 相机)
机械臂
二、软件环境
Ubuntu20.04 或 Win10
Python3.8 以上
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
Anaconda3 5.3(64-bit)
OpenCV-python4.8
Pytorch2.2.1
Jupyter notebook7.0.7
智能体Agent大语言模型:Yi-Large、Claude 3 Opus、
文心大模型 4.0 Turbo
多模态视觉理解大模型:GPT4v、GPT4o、Yi-Vision、
Claude 3 Opus、 智谱 CogVLM2-Grounding、 通义千问 Qwen-VL-Max