基于伪逆的反复学习控制.doc

上传人:滴答 文档编号:1255405 上传时间:2019-01-19 格式:DOC 页数:12 大小:747KB
下载 相关 举报
基于伪逆的反复学习控制.doc_第1页
第1页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基于伪逆的反复学习控制摘要学习控制是用于一固定时间间隔内重复作用的跟踪控制的有效方法。本文给出一种反复学习控制算法,适用于一些具有扰动和初始误差的非线性非最小相位对象。该算法要求对一线性对象的近似转换而非精确转换。这种方法的一个优点是不需区分对象的输出。渐进轨迹误差的范围通过一精确的试验列出,并且可以看到其随着扰动范围持续的增大。该控制器的结构是这样的,其低频部分的轨迹汇合要比高频部分快。索引术语反复学习控制,非线性跟踪,伪逆。I. 绪论反复学习控制用到了一类自调整控制器,其某一特定任务的系统性能在同一任务先前性能的基础上逐渐改善和完美。学习控制的最常见应用是在工业生产的机器人控制领域,这里要

2、求机器人执行一个单一的任务,比方说反复在一给定轨迹下取放物体。单独一个反馈控制器时,相同的轨迹误差会一直在反复的试验中存在。相反,学习控制器可以利用前一次执行信息来改进下一次轨迹执行的性能。而在一些应用中,多次重复一个轨迹的要求不利于学习,所以我们将注意力集中在别的一些场合,那里来说学习控制是自然的解决方案。本文中我们在1提出一种反复学习控制算法的修正以使其适用于带有输入扰动和输出传感噪声的非线性非最小相位对象。在章节 II,提出一个在起始位置描述一伪逆线性装置的学习控制器。在章节 III,举出仿真例子以展示所提学习控制器的性能。最后,章节 IV 是全文总结。II具有扰动的非线性非最小相位对象

3、本节中,我们为非线性系统提出一个鲁棒迭代学习算法。我们仅考虑方(相同的输入和输出)时不变非线性系统。A 系统描述来考察一个在 x = 0 时起始近似稳定(也就是说线性对象的所有特征根都在复平面的左半部分)而且输入稳定的非线性系统这里 i 为 ILC 的迭代系数, 是输入顺序集合, 及 ,。方程 表示系统反复随机的有界扰动;它可以是持续的,非可再生摩擦力,和状态独立的模型误差等等。 代表传感器噪声。所期待的轨迹 维持在有限的时间域。学习的目的是构建一个输入轨迹的顺序 如 ,这样 使系统在0,T 间“尽可能近的”跟踪轨迹 。我们做以下假设:(A1)方程 是连续可微的,而 是连续的。(A2) ,这里

4、的 是 Banach 空间的封闭子集。(A3)系统是第一渐进稳定和输入状态稳定。(备注:如果系统不稳定,可以运用我们的方法使其稳定)。(A4)扰动 和 分别由 bw 和 bv 限制(也就是说, 且 ) 。(A5)所期待的轨迹 非常接近于轨迹 , 其满足以下方程:针对该系统,在图 1.B 中给出一个反复学习控制。B.学习控制器的描述本节中,图 1 所示的学习控制器的一个好的候选者可以这样获得,首先对对象进行线性化,然后用一个伪逆的线性装置作为学习控制器。现代的反复学习控制法则由因式 P,线性对象 ,其伴随矩阵 和时域 t0,T组成,也就是:注意到对所有的 i 如果 (注意在图 1 中,减因子 放

5、置在汇合点之前) 。定义 : 由于非线性系统(1)是输入状态稳定(A5 )且 是连续的(A1 ) ,因此这样定义一个因果关系的非线性输入到输出的映射P: 。因为 P 是第一状态渐近稳定的(A5) ,我们定义一稳定时不变的输入到输出线性因式 , 需要对系统(1)在内 线 性 化 :图 1, 非 线 性 学 习 控 制 系 统 P: 非 线 性 对 象 , LC: 学 习 控 制 器 , : 负 因 子这 里 , 因 此 ,。 由 于 且 A 为 赫 兹 【 在 ( 4) 中 】 , 我 们 可 以 用代 替 而 不 必 改 变 ( 4) 中 定 义 的 输 入 输 出 ( I_O) 映 射 ,

6、因 此 得 到 的唯 一 映 射 是 11。定 义 : 考 察 伴 随 系 统 的 IO 映 射由 于 A 是 赫 兹 , AT 为 双 曲 线 的 ( 也 就 是 , 所 有 的 特 征 值 都 没 有 零 实 部 ), 从 而 ( 5) 式 定 义了 唯 一 的 无 关 联 映 射 , 如 Devasia 等 给 出 的 ( 参 见 附 录 ) 。 伴 随 系 统 满 足 .定义 : 忽略较高阶限制,我们可以在方程(1)的解 附 近 获 得 一 个 线 性 对 象 :这 里 。 因 为 ( 4) 是 稳 定 的 , 可以 根 据 李 亚 普 诺 夫 方 法 证 明 , 如 果 有 界 那

7、么 ( 6) 也 是 有 界 输 入 输 出 稳 定 的 。 注 意 , 这 里我 们 也 可 以 用 代 替 ( 如 ( 4) 中 ) 而 且 没 有 改 变 输 入 输 出 映 射 。定 义。 线 性 稳 定 系 统 ( 6) 有 解 并且 定 义 了 一 个 线 性 输 入 输 出 映 射 : 。定 义 : 由 伪 逆 【 4】 的 观 念 启 发 , 我 们 通 过 下 面 的 线 性 因 子 来 定 义 学 习 控 制 器 :因 为 , 我 们 把 “近 似 反 转 ”称 为 的 伪 逆 。 为 简 单 起 见 , 下 文 把 伪 逆 称为 简 单 伪 逆 。 在 时 域 下 用 (

8、 4) 和 ( 5) :因 为 是 稳 定 的 , ( 8) 是 具 有 特 征 根 的 双 曲 线 , 因 此 , 【 2】 中且 是 无 关 联 的 。 在 ( 8) 中 解 , 我 们 可 以看 到 反 向 算 子 为 :上 面 系 统 的 特 征 根 的 连 续 函 数 。 在 极 限 为 双 曲 线 的 ( 因 为 A 为 赫 兹 ) 。 从 而我 们 通 常 对 双 曲 线 选 择 一 个 。 系 统 ( 9) 可 以 根 据 Devasia 等 人 的 稳 定 无 关 解 方 法 解 决 。因 此 ,学 习 控 制 器 是 伪 逆 且 在 时 域 中 给 出 :Ac 是 对 角

9、块 , 因 此 Ac 的 特 征 根 是 ( 9) 和 的 特 征 根 。 由 于 是 双 曲 线 的 , 因 此Ac 为 双 曲 线 。 从 而 , 及 (10)所 描 述的 线 性 控 制 器 的 解 可 以 利 用 稳 定 无 关 解 2求 得 。 ( 使 用 时 而 不 是 时 的 初 始 条 件可 以 通 过 控 制 ) 。 因 此 跟 踪 性 能 可 以 根 据 假 设 和得 到 改 善 。C 集 中 分 析定 义 1: 我 们 为 方 程 定 义 标 准 :注 意 意 味 着 和 是 等 价 的 标 准 。 集 中 结果 可 以 用 任 一 标 准 证 实 。导 致 的 标 准

10、:定 义 的 傅 立 叶 变 换 。条 件 1: ( 也 就 是 说 , 轴 上 没 有 确 定 或 者 非 确 定 的 零 点 ) , 遵 循。法 则 1: 如 果 假 设 ( A1 A5) 和 条 件 1 满 足 , 没 有 扰 动 ( 即 且 ) 和 初 始 误 差 () , 那 么 算 则 ( 3) 导 出 了 一 个 输 入 顺 序 , 输 入 汇 合 于 。 如 果 , 及 初始 状 态 误 差 是 有 界 的 ( ) , 随 着 , 汇 合 于 。 球的 半 径 r 连 续 的 取 决 于 扰 动 , 和 初 始 误 差 界 限 。 如 果 存 在 一 个 具 有的 , 那 么

11、将 汇 合 于 期 望 的 输 入 解 。验证:验证依赖于对输入顺序应用不同的收缩映射定理5。验证的主要想法是在时 展 现 出 。 这 表 明 了 极 限 , 这 儿 为 扰 动 和 初 始 误 差 界 限 的 连 续 因 子 。 通 过 以 下 定 义 构 造 序 列: 为 简 单 起 见 下 文 用 表 示 。 现 在 , 维 持 页 尾 所 示 的 从 ( 3) 到 关 断 器( 12) 的 线 性 。 在 6后 , 我 们 用 表 示 P 的 分 叉 , 也 即 满 足在 式 ( 13) 中 , 这 样 定 义 : 。 从 ( 13)式 , 我 们 可 以 发 现 s 就 是 , 为

12、表 示 , 我 们 重 写 ( 12) 如 下 :因为 是 ,这表明 ,如限制 和 :由假设 :,从而 。由(6) ,我们列写:因此,利用三角不等式, 及 的限制,我们得到。利用GronwallBellman 不 等 式 ( 见 )。 用 乘 式 ( 15) , 定 义且 假 设 , 我 们 得 到 :注 意 到 对 一 常 数 , 在 上 较 大 值 , 我 们 有 :和(4)相似,可以证明:这里 为式(4)的输入。定义 :定义一线性因子 ,所以:根据式(6) ,因子 的输出为: ,且由式(4)因子 的输出为 。这表明因此,利用式(16) , (17) ,及 的范围,我们可以得到:列出压缩映

13、射:由式(12) ,我们可以得到下文页底所示的方程。定义。从以下可看到,如果 满足条件 1,当 ,那么 。当 选择足够小,可以使得 任意小。令 且 ,( 傅立叶变换)如果条件 1 满足,那么 ,这里 0。重新考虑式(19) ,令,因此 。注意到:因此,我们可以写为, (利用式(19) ),当。随着 的选择,可以使得 任意小。如果相应于 的传递函数确实恰当,那么在 时,条件 1 无法满足。那么随着1,而且,直观地,输入序列的高频部分会缓慢的汇合。在那种情况下,学习控制器得以以下方式加以修正:不是把 当作学习因子,而是把 当作修正后的学习控制器,这里 可以通过对 加入一个前馈期获得。因此,可以根据

14、修正式(4)给出如下:这里 。修正后的因子满足条件 1 并且集总分析可以在 足够小时以相同的方式进行。从式(19)代人限制条件 ,且将式(19)乘以 我们可以在 上取大列写式(19)的 型如下:这里 为初始状态误差的标准范围。 和 分别为输入及输出扰动的标准范围。由于 ,当 足够小,我们可以发现 ,这使得 。因此,得到:。这里 包括了控制器的初始状态误差和扰动的标准范围。因此,极限 ,即 ,如,这里 为收缩映射 的固定点,且 为半径,球心为 的开球体。如果没有扰动和初始误差, ,从而 汇合于。如果 如 ,收缩映射 的固定点 表示为没有 和初始误差的。如果 且 。这表明学习控制器的输出 为 0。

15、因此,收缩一旦得以证实,可以看出 (如前定义)也是从 空间( )的封闭子空间到其自身的映射。因此, 为收缩映射。为说明这个,来考察一期望轨迹 。从式(2) ,因 , 。在式(12)中,如果考虑 那么,由于(这里 ) , 是从 附近一封闭球到其自身的收缩映射。注意, 附近球的尺寸必须足够小这样式(14)也得到满足。因此,如果初始轨迹位于 附近, 对所有的 从其附近到其本身构成映射。不失一般性,我们考虑另一对 及 (如(2)所给) 。从连续性来说,尽管 充分接近 , 也从其附近到其本身构成映射。这便是 的动机。仿真结果具有输入扰动的仿真结果本节中,我们展示一个单输入单输出非线性非最小相位对象 P

16、的仿真研究,其起始渐进稳定,输入状态稳定,具有以下描述的输入扰动:首先,我们考虑没有输出扰动 。这样给出参考输出轨迹:0, 其他。通过线性化系统(21)这样定义 :由于线性控制器是非稳定的,我们应用稳定无关解方式2。我们引入 作为有界的输入扰动。 通常为限制于 间的随机数。 仿真图 2(a)和(b) 展示了两个反复后期望输出的近似完美的跟踪。注意高频部分缓慢汇合所引起的余差。具有输入输出扰动的仿真结果现在,我们引入 作为(21)所给的相同非线性系统的随机有界输出扰动。同时存在先前引入的输入扰动 。 仿真图图 3展示了三次反复后期望输出轨迹的良好跟踪。A 讨论这里的 ILC 方案比1中给出的多了

17、一些优点。在1中,线性对象的逆 被当做学习因子。这使得用输出的分叉颠倒系统成为必要。实际上,在具有输出传感噪声时分叉无法可靠的计算。进一步说,对象本身会产生一个不可区分的输出信号。然而,这种新的学习算法中,不需要在每一反复用输出分叉计算系统输入的更新条件。 (注意 必须非零) 。图 4(a)和(b)给出了线性对象 的频率响应,它的精确逆 和伪逆(具备 ) 。在我们先前的方案1中,学习因子 具有如图 4(b)所示的高频下的高增益。因此,高频噪声被学习因子放大。从图 4(b)中我们可以看到的频率响应在低频时具有和 相似的表现,但在高频时偏离,证明了其低通本性。从而高频传感噪声被滤除掉了。精确逆和伪

18、逆的相位响应是相同的(看图 4(b) ) 。注意 是一个零相位滤波器。几个反复后,可以达到低频部分的良好跟踪,同时输出误差信号的高频部分更缓慢地汇合。这种行为可以由图 2(a )和(b) 得到证实,图中我们可以看到低频误差在起初几个反复内汇合于零,而高频误差使大量的反复衰减。在7中,比例因子为数量级微克,而且本文中质量为一算子(不必因果关系的) ,通过伪逆的调整给出。有趣的是,两个方案中学习控制器的相位等于对象相位的相反数。我们的论文建立于早期的工作,因为算子份量在一带宽内导致了对象的逆,而且你可以期待在那频带内快速汇合。更甚者,如果多变量对象在其最小和最大奇异值间具有明显的散布,伪逆自动地在

19、对象不同的空间方向测量学习控制器的增益。Furuta 和 Yamakita的三角修正急速升降方法7具有和伪逆学习控制器相同的高频复制特性。并且,我们发现在机器人反馈控制系统中应用传递函数的倒像去设计控制器,而在需要时切断学习。图 2。具有输入扰动的非线性非最小相位系统的跟踪(a)三次反复后(b)10 次反复后总结图 3。具有输入输出扰动非线性非最小相位系统三次反复后的跟踪, 为实际(非测量)输出。本文提出的学习算法在一些相当一般的假设前提下确保了学习。理论的判断伪仿真结果所证实,证明了在随机有界的扰动情况下跟踪误差一律是有界的。这种方案的主要优点是我们可以从学习更新法则中消除差分因子,这使我们可以研究一些更一般化的非线性对象。该学习算法可以通过应用 Coppel10方法轻易的加到缓慢时变对象中。学习算法应用于带非模型动力学的线性对象中11,在将来扩展到时变对象中。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。