下载百度汉语App
名师好课免费看

Navid

百科释义

报错

NaVid是由北京智源研究院于2024年6月发布的端到端多模态具身导航大模型。该模型可直接接收机器人视角的视频和用户自然语言指令作为输入,并输出移动控制信号。与传统导航技术相比,NaVid无须预先建图,也不依赖深度传感器或里程计数据,仅通过单视角RGB视频流实现导航。基于合成导航数据与Sim2Real技术,NaVid能在真实室内外场景中完成zero-shot泛化。截至2024年8月,NaVid已作为关键技术应用于银河通用的盖博特人形机器人,实现自然语言交互与智能导航。 查看百科

注:百科释义来自于百度百科,由网友自行编辑。