”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 人工智能 > CMUÐ实现突破:机器狗突破速度与安全的平衡,完美穿越障碍!

CMUÐ实现突破:机器狗突破速度与安全的平衡,完美穿越障碍!

时间:2024-02-24 23:54:19
浏览:394 来源:https://www.jiqizhixin.com/articles/2024-02-05-8

大家好,今天本人给大家带来文章《CMUÐ实现突破:机器狗突破速度与安全的平衡,完美穿越障碍!》,文中内容主要涉及到,如果你对科技周边方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!

CMU和ETH Zurich团队合作开发了名为"敏捷但安全"(ABS)的新框架,为四足机器人在复杂环境中实现高速运动提供了解决方案。该框架不仅在避免碰撞方面表现出高效能力,而且实现了前所未有的3.1毫秒极速运动。这一创新为足式机器人领域带来了新的进展。

在高速机器人运动领域,同时保持速度和安全性一直是一个巨大的挑战。然而,卡内基梅隆大学(CMU)和苏黎世联邦理工学院(ETH)的研究团队最近取得了突破性进展。他们开发的全新四足机器人算法不仅能够快速移动于复杂环境中,还能巧妙地避开障碍物,真正实现了“敏捷且安全”的目标。这项算法的创新之处在于它能够快速地识别和分析周围环境,并根据实时数据做出智能决策。通过使用先进的传感器和强大的计算能力,机器人能够准确地感知周围的障碍物,并通过调整步态和轨迹来避开它们。这项技术的成功应用将极大地推动高速机器人的发展

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

论文地址: https://arxiv.org/pdf/2401.17583.pdf

在 ABS 的加持下,机器狗在各种场景下都展现出了惊艳的高速避障能力:

障碍重重的狭窄走廊:

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

凌乱的室内场景:

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

无论是草地还是户外,静态或动态障碍,机器狗都从容应对:

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

遇见婴儿车,机器狗灵巧躲闪开:

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

警告牌、箱子、椅子也都不在话下:

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

对于突然出现的垫子和人脚,也能轻松绕过:

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

机器狗甚至还可以玩老鹰捉小鸡:

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

ABS 突破性技术:

RL+ Learning model-free Reach-Avoid value

ABS 采用了一种双策略(Dual Policy)设置,包括一个「敏捷策略」(Agile Policy)和一个「恢复策略」(Recovery Policy)。敏捷策略让机器人在障碍环境中快速移动,而一旦 Reach-Avoid Value Estimation 检测到潜在危险(比如突然出现的婴儿车),恢复策略就会介入,确保机器人安全。

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!
创新点 1:怎么训练一个敏捷策略 Agile Policy?

敏捷策略的创新之处在于,与以往简单地追踪速度指令不同,它采用目标达成(position trakcing)的形式来最大化机器人的敏捷性。这一策略训练机器人发展出感知运动技能,以在没有碰撞的情况下达到指定目标。通过追求基座高速度的奖励条件,机器人自然学会在避免碰撞的同时实现最大敏捷性。这种方法克服了传统速度追踪(velocity tracking)策略在复杂环境中可能的保守限制,有效提高了机器人在障碍环境中的速度和安全性。Agile Policy 在实机测试中极速达到了 3.1m/s
CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!
创新点 2:学习 Policy-conditioned reach-avoid value

「达防」(Reach-Avoid, RA)值学习的创新之处在于,它采用了无模型的方式学习,与传统的基于模型的可达性分析方法不同,更适合无模型的强化学习策略。此方法不是学习全局 RA 值,而是使其依赖于特定策略,这样可以更好地预测敏捷策略的失败。通过简化的观测集,RA 值网络可以有效地概括并预测安全风险。RA 值被用于指导恢复策略,帮助机器人优化运动以避免碰撞,从而实现在保证安全的同时提高敏捷性的目标。

下图展示了针对特定障碍物集合学习到的 RA(达防)值。随着机器人速度的变化,RA 值的分布景观也相应变化。RA 值的符号合理地指示了敏捷策略的安全性。换句话说,这张图通过不同的 RA 值展示了机器人在不同速度下,面对特定障碍物时的安全风险程度。RA 值的高低变化反映了机器人在不同状态下执行敏捷策略时可能遇到的安全风险。

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!
创新点 3:用 Reach-Avoid Value 和恢复策略来拯救机器人

恢复策略的创新之处在于,它能使四足机器人快速追踪线速度和角速度指令,作为一种备用保护策略。与敏捷策略不同,恢复策略的观测空间专注于追踪线速度和角速度命令,不需要外部感知信息。恢复策略的任务奖励专注于线性速度追踪、角速度追踪、保持存活和保持姿势,以便平滑切换回敏捷策略。这种策略的训练同样在仿真环境中进行,但有特定的域随机化和课程设置,以更好地适应可能触发恢复策略的状态。这种方法为四足机器人提供了在高速运动中快速应对潜在失败的能力。

下图展示了当恢复策略在两个特定情况(I 和 II)下被触发时,RA(达防)值景观的可视化展示。这些可视化展示是在 vx(沿 x 轴的速度)与 ωz(绕 z 轴的角速度)平面以及 vx 与 vy(沿 y 轴的速度)平面上进行的。图中显示了搜索前的初始旋转状态(即机器人基座当前的旋转状态)和通过搜索得到的命令。简单来说,这些图表展示了在特定条件下,通过恢复策略搜索得到的最佳运动指令,以及这些指令如何影响 RA 值,从而反映机器人在不同运动状态下的安全性。

CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!
鲁棒性测试

作者在「12kg 负载 / 篮球撞击 / 脚踢 / 雪地」的四个场景下测试了 ABS 框架的鲁棒性,机器狗都从容应对:
CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!
研究团队

这项研究是由 CMU 和 ETH 的研究团队共同完成。团队成员包括 Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu 和 Guanya Shi。他们的合作不仅在机器人技术领域取得了重大突破,更开启了四足机器人新的应用可能。这项技术的成功展示了四足机器人在高速移动和安全避障领域的巨大潜力。未来,这种高速且安全的四足机器人有望在搜救、探险甚至是家庭服务等多个领域发挥重要作用。CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

以上就是《CMUÐ实现突破:机器狗突破速度与安全的平衡,完美穿越障碍!》的详细内容

版本声明 本文转载于:机器之心如有侵犯,请联系study_golang@163.com删除
最新教程 更多>
  • 担心美国科技巨头操纵全球AI市场,英国监管机构发起多项调查
    担心美国科技巨头操纵全球AI市场,英国监管机构发起多项调查
    英国竞争与市场管理局(CMA)日前表示,对美国科技公司可能会操纵全球AI市场感到担忧。CMA正在调查一些主导AI基础模型(如FM)开发和运营的科技公司,以及它们之间(例如OpenAI与微软)的合作方式。该机构指出,这些科技公司建立了一个由90多个合作伙伴组成的“互联网网络”(如图1所示),并获得了谷歌、苹果、微软、Meta、亚马逊、英伟达等的投资。CMA担心,这些投资可能被用来对其他公司进入AI市场设置障碍。image001.jpg图1:美国科技巨头组成的“互联网络”CMA此项调查建立在去年完成的初步调查
    人工智能 发布时间:2024-04-15
  • 聊聊端到端与下一代自动驾驶系统,以及端到端自动驾驶的一些误区?
    聊聊端到端与下一代自动驾驶系统,以及端到端自动驾驶的一些误区?
    最近一个月由于众所周知的一些原因,非常密集地和行业内的各种老师同学进行了交流。交流中必不可免的一个话题自然是端到端与火爆的特斯拉FSDV12。想借此机会,整理一下在当下这个时刻的一些想法和观点,供大家参考和讨论。如何定义端到端的自动驾驶系统,应该期望端到端解决什么问题?按照最传统的定义,端到端的系统指的是一套系统,输入传感器的原始信息,直接输出任务关心的变量。例如,在图像识别中,CNN相对于传统的特征提取器+分类器的方法就可以称之为端到端。在自动驾驶任务中,输入各种传感器的数据(相机/LiDAR/Rada
    人工智能 发布时间:2024-04-15
  • Js-pytorch:开启前端+AI新世界
    Js-pytorch:开启前端+AI新世界
    Hello大家好,我是徐小夕。最近在Github上发现了一个非常有意思的框架——js-pytorch。它可以让前端轻松使用javascript来运行深度学习框架。作为一名资深前端技术玩家,今天就和大家分享一下这款框架。在目前人工智能领域中,深度学习技术已经成为了一项备受关注的技术。PyTorch是其中一个备受关注的深度学习框架。这个框架在深度学习领域中具有重要的发展速度。js-pytorch利用JavaScript技术引入了PyTorch的强大功能,使其能够在JavaScript世界中进行使用和开发。Ja
    人工智能 发布时间:2024-04-15
  • 一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法
    一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法
    神经网络作为深度学习技术的基础已经在诸多应用领域取得了有效成果。在实践中,网络架构可以显著影响学习效率,一个好的神经网络架构能够融入问题的先验知识,确立网络训练,提高计算效率。目前,经典的网络架构设计方法包括人工设计、神经网络架构搜索(NAS)[1]、以及基于优化的网络设计方法[2]。人工设计的网络架构如ResNet等;神经网络架构搜索则通过搜索或强化学习的方式在搜索空间中寻找最佳网络结构;基于优化的设计方法中的一种主流范式是算法展开(algorithmunrolling),该方法通常在有显式目标函数的情
    人工智能 发布时间:2024-04-15
  • ReFT(表征微调):比PeFT效果更好的新的大语言模型微调技术
    ReFT(表征微调):比PeFT效果更好的新的大语言模型微调技术
    ReFT(RepresentationFinetuning)是一种突破性的方法,有望重新定义我们对大型语言模型进行微调的方式。斯坦福大学的研究人员最近(4月)在arxiv上发布的论文,ReFT与传统的基于权重的微调方法大有不同,它提供了一种更高效和有效的方法来适应这些大规模的模型,以适应新的任务和领域!在介绍这篇论文之前,我们先看看PeFT。参数高效微调PeFTParameterEfficientFine-Tuning(PEFT)是一种微调少量或额外的模型参数的高效微调方法。与传统的预测网络微调方法相比,
    人工智能 发布时间:2024-04-15
  • 马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合
    马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合
    马斯克的第一代多模态模型Grok-1.5V,终于来了!Grok1.5V,号称是能连接数字世界和物理世界。除了文本功能,它还能处理文档、图标、屏幕截图和照片之类的各种视觉信息。很快,所有早期测试者和所有Grok用户就能用上Grok1.5V了。JimFan,英伟达高级科学家,发现了Grok-1.5V的“最大亮点”:在他看来,Grok-1.5V最令人感兴趣的,就是解决自动驾驶边缘案例的潜力。通过使用“思维链”,可以帮助汽车解决复杂场景,用规则和反事实进行推理,解释其决策,Grok-1.5V能够将感知提升至像素级
    人工智能 发布时间:2024-04-15

免责声明:提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:lupingnet@sina.com 我们会在看到邮件的第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3