路径规划中的DRL与OR算法：对比与展望｜得物技术

Source : mp.weixin.qq.com Author : 有竹

近些年，以机器学习为代表的人工智能技术逐渐被大家认识并在很多方面得到普及，深度学习技术在学术界和工业界取得了广泛的成功，受到高度重视，并掀起新一轮的人工智能热潮。运筹学作为一个看似古老的学科，科学家和工程师在过去开发了各种启发式或精确的求解方法，能够在有限的时间内返回一个尽可能好的结果。值得注意的是，上述算法均诞生于这轮AI大爆发之前，在AI时代，如何将最新的机器学习技术应用在运筹和组合优化，正在受到越来越多的关注。在芯片设计、求解器等“卡脖子”领域，基于机器学习的组合优化方法很可能成为将来的基础性技术。本博客以路径规划为例，探讨了传统的优化方法、深度强化学习类方法的研究现状和交叉融合趋势，分析了各自的特点以及在实际落地亟需解决的若干问题，也希望能探索相关算法在得物供应链场景的落地实践。