来源:Engineering 发布时间:2025/4/30 10:41:56
选择字号:
基于逆强化学习理论,智能车辆拟人化避障轨迹规划取得新进展 Engineering

论文标题:Research on Anthropomorphic Obstacle Avoidance Trajectory Planning for Adaptive Driving Scenarios Based on Inverse Reinforcement Learning Theory

期刊:Engineering

DOI:https://doi.org/10.1016/j.eng.2023.07.018

微信链接:点击此处阅读微信文章

中国工程院院刊《Engineering》发表了一项由清华大学刘亚辉团队与聊城大学研究人员共同合作的智能车辆避障轨迹规划研究成果。研究团队提出基于逆强化学习理论的自适应行车场景拟人化避障轨迹规划策略,为智能驾驶领域的技术发展提供了新的解决方案,有望改变现有轨迹规划技术的困境。

在智能驾驶领域,轨迹规划是连接决策层和控制执行层的关键环节。目前现有的轨迹规划技术,如基于图搜索、采样、曲线插值和数值优化等方法,虽能解决避障轨迹的安全性和效率问题,但大多需要预先设计轨迹优化函数。面对复杂多变的驾驶场景,手动设计优化函数不仅繁琐困难,还难以适应不同场景,且无法准确生成符合真实驾驶员行为习惯的避障轨迹。

针对这些问题,该研究团队另辟蹊径。他们首先从HighD自然驾驶数据集中提取大量专家示范轨迹,为后续研究提供真实可靠的数据支撑。随后,团队提出轨迹期望特征匹配算法,借助最大熵逆强化学习理论对专家示范轨迹进行学习。通过这种方式,能够自动获取专家示范轨迹的优化函数,避免了复杂的人工参数调整过程。

图1 HighD数据集的信息示意图。DHW:车头间距;THW:车头时距;TTC:碰撞时间。

研究团队还考虑到驾驶场景对避障轨迹的影响,将本车速度以及本车与前车的速度差等关键驾驶场景信息,与优化函数的权重相结合,构建映射模型。这样一来,所提出的拟人化避障轨迹规划策略就能够根据不同驾驶场景实时调整轨迹优化函数的权重分布,生成更符合真实驾驶习惯的拟人化轨迹。

为验证策略的有效性,研究团队进行了多方面的验证。从HighD数据集中选取样本验证算法,结果显示不同初始轨迹特征权值下最终学习到的轨迹相似,证明算法有效且稳定。在映射模型验证中,确定本车与前车速度差和车速是关键影响因素,并得到准确映射关系。通过仿真和硬件在环(HIL)测试平台实验进一步表明,该策略在不同驾驶场景下,能依据紧急程度和安全程度自动调整权重系数,规划出更适应场景的避障轨迹,且具有良好的实时性能和可接受性。

这一研究成果提高了轨迹优化函数的可接受性和对驾驶场景的适应性,显著提升了驾驶安全性。未来,研究团队计划设计更复杂可靠的映射模型,并通过真实汽车测试进行充分验证,同时还将研究拓展到典型非直线道路条件下的商用车避障轨迹规划,持续推动智能驾驶技术的发展。

引用信息:

Jian Wu, Yang Yan, Yulong Liu, Yahui Liu. Research on Anthropomorphic Obstacle Avoidance Trajectory Planning for Adaptive Driving Scenarios Based on Inverse Reinforcement Learning Theory. Engineering, 2024, 33(2): 133?145 https://doi.org/10.1016/j.eng.2023.07.018

Open access

开放获取全文

https://www.engineering.org.cn/engi/EN/10.1016/j.eng.2023.07.018

更多内容

新型控制框架为智能网联汽车编队安全保驾护航

汽车主动悬架系统研究进展

南洋理工大学团队创新强化学习算法,为自动驾驶安全决策 “保驾护航”

先进压缩空气储能系统助力可再生能源发展

李静海院士团队:未来数据系统的逻辑与架构

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
科学网2025年4月十佳博文榜单公布! 实验室制造出首枚“黑洞炸弹”
氧化物-氧化物界面催化研究取得新进展 哈佛认证抗衰清单:红茶+浆果有助逆龄
>>更多
 
一周新闻排行
 
编辑部推荐博文