[论文]一种用于水下机器人分布式编队控制的自适应自组织神经网络方法

摘要

针对一组自主水下机器人的分布式编队控制，提出了一种自适应自组织映射神经网络方法。当编队整体移动时，这种方法控制水下机器人在编队中保持它们的位置。该组水下机器人可以沿着预先规划的轨迹以预期的编队形状到达期望的位置。所提出的控制律是分布式的，即每个水下机器人的控制器只使用自己的信息和相邻水下机器人的有限信息。基于自组织竞争计算的编队控制策略是在考虑工作负荷平衡的情况下进行的，这样一组水下机器人可以在工作负荷平衡和能量充足的前提下到达期望的位置。而且队形可以避开障碍物，根据需要改变形状。编队是一个分布式的类似领导者-追随者的结构，但是没有必要明确地指定领导者和追随者。编队中的所有水下机器人被视为领导者和跟随者，从而实现了自适应和容错等重要特性。与传统方法和实验的比较结果表明了该方法的有效性。

索引术语——水下机器人、编队控制、编队保持、编队跟踪、领导者-追随者、自组织地图。

介绍

自主水下机器人(AUV)是一种高度自主的设备，它与母船没有物理连接，可以在水下环境中用自己的控制和引导系统完成给定的任务[1]。随着任务的日益复杂，有必要通过多个水下机器人的合作来执行超出单个水下机器人能力的水下任务。在某些任务中，水下机器人应该作为一个编队集体移动。编队控制是一种控制一组车辆的技术，包括地面机器人、飞行器、水面车辆和水下机器人[2]、[3]，根据任务需要沿着期望的路径移动，同时保持期望的形成模式，并适应环境约束，例如障碍、有限的空间、洋流和通信约束[4]，[5]。为了在特定的环境中工作或满足某些工作的需要，多水下机器人系统可以采用多种几何形状。典型的几何形状包括线形、三角形、菱形、楔形和多边形。

编队控制是多水下机器人系统的一个基本问题，近年来成为研究热点。以前文献中报道的各种编队控制方法主要分为四类:虚拟结构方案、基于行为的方法、人工势场技术和领导者-追随者方案。在虚拟结构方法中，整个编队被视为一个单一的刚体。每个智能体的运动是从结构上相应点的轨迹导出的[6]，[7]。该方法通过定义刚体的行为来实现编队控制。当航行环境发生变化时，刚体队形无法改变，从而限制了应用范围。在基于行为的方法中，每个车辆的控制动作由每个期望行为的加权平均值得出，例如编队保持、目标寻找和避障[8]–[10]。基于行为的方法的优点是相对简单，明确的反馈，以及在避障方面的可用性；缺点是缺乏对群体行为的明确定义，这使得难以用数学方法分析局部控制规则。

哈提卜[11]提出了基于人工势场概念的方法。这种方法的基本思想是车辆在类似于正负电荷产生的电场的力场中运动。要到达的位置是吸引电荷，障碍物是排斥电荷。障碍物对车辆产生排斥力，而目标对其产生吸引力。排斥力和吸引力可以形成一个势场，使车辆沿着势场的梯度下降方向运动。人工势场法的优点是定义明确，适合实时控制，特别是有障碍物环境下的避碰问题；不足之处在于势场函数有时难以设计，应考虑局部最小值问题[12]，[13]。

在地面、空中或水下的编队机器人控制中，领导者-跟随者方法被广泛采用。这种方法将整个编队分成几个小组，每个小组至少有两个水下机器人。在任意小的双AUV群中，一个AUV是领导者，另一个是跟随者[3]，[16]，[17]。跟随的AUV与领头的AUV保持一定的角度和距离。一个群体中的追随者可能是另一个群体中的领导者。跟随器的参考轨迹随着引导器的移动而生成，并且虚拟车辆被设计来跟踪该轨迹。位置跟踪控制用于跟随器跟踪虚拟车辆的轨迹。领导者-跟随者方法对整个编队有一个清晰的定义，可以用数学方法进行分析，从而确保编队的稳定性[18]–[22]。这种方法被广泛用于为机器人的编队控制提供框架[15]，[23]–[26]；然而，领导者-追随者方案在实际应用中遇到了一个关键问题:当领导者水下机器人发生故障时，其追随者也无法继续前进。如果破碎的AUV恰好是编队的领头人，那么整个团队都会失败，可能会造成灾难。在大多数情况下，领导者的信息，如航向角、线速度和线性加速度，不能实时显示。以下人员可以获得当地信息和水下地层中邻居的信息[27]–[30]。

本文针对多水下机器人系统的分布式编队控制，提出了一种自适应自组织映射方法。所提出的方法的贡献可以总结如下。
1)改进了基于自组织神经网络的分布式编队控制方法。虽然所提出的方法是基于领导者-追随者框架，但编队中的水下机器人是随机分布的，每个水下机器人被视为领导者或追随者。除非人工指定，否则水下机器人在编队中是充当领导者还是跟随者只取决于自适应算法本身。
2)在所提出的形成策略中引入新的学习速度参数 $\alpha$ 和 $\alpha_j$ ，以实现自适应和容错。由于这些特点，该方法以更有效的方式处理编队变换，并处理一些水下机器人发生故障的情况。这种方法克服了传统的主从模式的缺点，即在主从编队中，当一个领头的水下机器人发生故障时，它的跟随器也不能继续移动。给出了算法稳定性和收敛性的数学证明。
3)该策略强调减少总行程长度和工作量平衡。在算法中引入了新的工作负载平衡策略。在编队跟踪过程中，对总行进长度，即编队的能量消耗进行了优化。与传统的领导者-跟随者方法相比，该方法具有更高的导航效率。

论文的其余部分组织如下。第二节介绍了水下机器人的编队控制问题以及将自组织神经网络应用于编队控制的思路。第三节介绍了基于自适应自组织映射的分布式算法信息控制和编队跟踪。第四节提供了实验模拟结果。第五节是对拟议方法的总结

问题状态和准备

多水下机器人系统的一个主要挑战是水下编队控制，这是水下机器人在执行任务时协调与合作的基础。卡兰塔尔和齐默提出了一种方法，将编队控制考虑成两个解耦的问题:边界和内部[31]，但这种方法只适用于大规模的群。水下机器人在内层的位置也不是固定的。当编队中包含少量水下机器人时，它太复杂而无法使用。如今，在大多数水下任务中，水下机器人的数量不到十个。因此，我们提出了一种自组织神经网络方法来解决水下编队问题，该方法可以处理随机数量的水下机器人，而不需要区分边界和内层。在分布式编队中，所有的水下机器人都用这种方法保持在适当的位置，只有局部和邻近的信息。

A.水下机器人编队控制

在本文中，首先，我们假设一组同构的水下机器人在一个普通的工作空间中工作和运动，该工作空间可以是二维平面或三维空间。为了便于直观演示，本文使用了二维图形，尽管在解释算法时考虑了x、y和z轴。这些水下机器人在初始状态下随机分布在有界区域内，并有望形成相应的编队样式。每个水下机器人在编队中都有一个位置。领导者和追随者由算法选择。编队形成后，水下机器人的位置相对固定。整个编队按照任务需要无扭曲变形地移动。

如上所述，根据需要，地层可以是任何形状。一些典型的地层形状有三角形、菱形、楔形和多边形。在本文中，水下机器人信息形状包括对应于水下机器人的点。SOM方法处理的是确保每个点都有一个水下机器人可以到达。此外，水下机器人以最小的总费用和最小的能耗占据了所有的位置。这里，对于每个水下机器人，费用是通过从其初始位置到其在编队中的最终位置的行进距离来评估的。

图1显示了具有水下机器人和所需编队的典型工作空间，其中三个实心菱形代表起始位置随机分布的水下机器人，未实心菱形是形成三角形编队形状的点。虚线表示到达目的地所需的编队移动路径。此外，我们假设所有的自主式潜水器都是同质的，并具有基本的导航能力，因此本文不考虑运动学约束。首先，水下机器人预计将到达(黑边未填充钻石代表的)位置，形成三角形编队。其次，整个编队沿着期望的路径向目的地移动。考虑了总行驶成本的降低和每个水下机器人的工作负荷平衡。
在这里插入图片描述

未完待续

仿真结果

本节旨在演示上述算法的有效性。仿真是在初始状态随机分布的几个水下机器人上进行的。基于该方法，实现了用MA TLAB语言编写的程序。参数在我们的模拟过程中进行了修改，以获得最佳效果，并解释了图形和表格的结果。请注意，由于许多线条和曲线的三维图形无法清晰显示，因此我们使用本文中图形的平面图。为了验证所提出的方法能够应用于实际系统，本部分还进行了基于硬件的实验。工作空间的地图由声纳或基于激光的同时定位和绘图(SLAM)生成。整个编队的运动轨迹由人工势场法生成。

A.六水下机器人编队保持与编队跟踪

首先，将提出的方法应用于工作空间有六个水下机器人形成三角形并向目的地移动的情况。该方法用于控制编队沿轨道向目标运动。基于多水下机器人系统自适应自组织行为的整个时间相关过程如图4所示。工作空间是一个有界的正方形，其中(x，y，z) $\in$ 为0.50米。

在现实世界中，跟踪路径是由SLAM模块和路径规划算法生成的。由于环境中有障碍物，水下机器人团队进行改造以避免碰撞。在开始的地方，一个由六个水下机器人组成的团队随机分布，正如填满的黄色钻石所代表的那样。基于自组织神经网络方法，形成三角形编队。然后编队作为一个整体沿着路径移动。队伍通过狭窄的地方后，队形恢复并向目的地移动，如图4所示。在有障碍物的狭窄位置，设置虚拟编队形状以保证编队能够通过，基于自组织映射的方法指导水下机器人形成虚拟编队形状。此后，可以通过相同的策略恢复三角形的形成形状。
在这里插入图片描述

结论

针对三维工作环境下多水下机器人系统的编队控制问题，提出了一种基于自组织神经网络的方法。计算过程包括网络初始神经权值的特殊定义、获胜者的选择规则、工作量平衡法则、权值更新方法和编队跟踪策略。基于自组织神经网络方法，可以实现编队保持和编队跟踪。这种自适应方法引导一组非完整的水下机器人沿着期望的路径编队移动到期望的目的地。此外，变形改变其几何形状以避开障碍物也是一个复杂的问题。在能量充足的前提下，合理调整总行程长度和工作负荷平衡。此外，该方法具有容错特性。仿真结果验证了该方法的有效性，并与传统的主从控制方法进行了比较，结果表明该控制律可以应用于实际系统。

在现实世界中，会有更多的不确定性，比如移动障碍物。该算法应该能够执行动态无碰撞策略以及处理严重的洋流影响，这将在我们未来的研究中进行研究。

论文链接