1、 采用主元测地线(最短线)分析的运动压缩摘要:由于在娱乐业对人体动画数据的的日益增长的大量需求,压缩动作捕获序列,以减轻他们的存储和传输,已成为一种必然。我们提出一种对人体运动数据的新型有损压缩方法,利用时间和空间的连贯性。给定一个动作,我们首先使用在骨架的构型空间内的主元测地线分析(PGA)来近似姿势的大致流型。然后我们搜索这个匹配末端操纵器约束的姿势的近似流型,并使用一个允许实时的、数据驱动的逆运动学的迭代最小化算法。压缩的实现是通过只存储伴随着末端操纵器和根关节轨迹的近似流型参数,并且,在输出数据上也被压缩。我们使用给定了末端操纵器轨迹的 IK 算法恢复姿势。我们的实验结果表明,使用我们
2、的方法可以得到相当大的压缩率,并且有更少的重建和感性的错误。分类和主题描述符(根据对 ACM CCS 的):图形学 I.3.7:立体图形(三维图表)和现实主义的动画-视觉和场景理解I.2.10:运动-:1. 引言动作捕获已成为在任何需要高品质,精确的人体运动数据领域,都无处不在的技术。随着大型多人在线游戏的产生,这些数据的大量传输成为一个问题。此外,为了给用户提供广泛的动画,一些动作捕捉序列往往要马上被使用:运动数据要么是从一个动作数据库中挑选,要么利用对现有数据的混合或学习来创建。在这种情况下,一个紧凑并且容易编辑的动作数据的表示可以大大改善用户体验,同时降低存储需求。原始的(未加工的)运动
3、捕获数据实在是非常大的:他们存在于采样标记轨迹或跨越时间的关节方向的集合体中。随着120 Hz 的采样率和骨架的大约40个标记,数据大小迅速增长变大。然而,人体运动表现出内在的冗余,可以被压缩目的利用:时间相干性,这要归功于该运动可以用一些缺失信息关键帧,关节运动的相关性,它允许在一个较小的子空间的运动表示。我们提出了一个人体运动数据的新颖,有损压缩,两者都加以利用。首先,我们利用在骨架配置空间的主测地线分析(PGA)近似构成流形。这种模式得到一个减少了的,数据驱动姿势参数,然后这个参数在逆运动学(IK)的算法中被用来恢复只给定最终关节位置的姿势。多亏了这个算法,我们能够重建只给定最终接头轨迹
4、和根关节位置和方向的运动。因此,主要思想是仅通过存储这些精简模型与最终关节和根关节的轨迹执行压缩。由于我们在减压、典型的压缩失真,如脚滑冰自动降低时,约束了最终关节的位置。通过修改这些最终关节轨迹,也可以用我们的方法轻松地编辑运动压缩。我们的实验结果表明:显著地压缩率和更少的失真可以利用使用这种方法得到,同时保持轻松,自然地编辑合成的运动的可能性。我们的方法在现代机器上很容易实现并且运行相当快。本文的其余部分安排如下:在第2节中回顾相关工作。在第3 节中提出压缩技术概述。随后简要介绍的非线形工具,他们在我们的系统会被使用到。第4节致力于实验结果,压缩的表现在结果中被估计。第5节以提出的方法和今
5、后可能的工作的讨论作总结。2. 背景及相关工作2.1. 运动压缩虽然在近期作品中也可以找到关于动作捕捉数据压缩的内容,运动压缩问题一直到目前为止主要集中在动画网格压缩:这些高维数据往往呈现高空间和时间相干性,能被用来减少数据大小。 Len99检测刚体运动的部分网格,只编码转换和残差。可能存在于移动物体的部分中的相关数据也通过使用主合成分析(PCA)SSK05 被利用,压缩网格顶点。骨架运动也表现出这些“交叉骨头”的相关性。这些主要在优化框架中被利用,因为他们可以减少搜索空间的维数。SHP04在一组类似的动作上套用 PCA,为了在这样一个减少了的空间中合成动作。 GMHP04使用概率的潜变量空间
6、进行逆运动学,保留文体属性。 LM06检测运动节段,关节位置在于减少线性子空间和使用 PCA 来降维压缩。运动捕获数据也表现出时间相干性性,这也可以被利用来得到压缩:LM06使用样条关键帧压缩在运动节段标记的 PCA 投影。 Ari06使用样条线表示全球标记轨迹。然后整个运动数据库的控制点使用集群 PCA 被压缩。在这两种情况下,与全球标志位置一起起作用,需要额外优化以保持骨长度在合成运动中恒定。其他方法使用旋转的数据:BPP07 通过自动选择基础元素的方式,最大限度地减少二次误差,来选择关节角度,适应标准的小波压缩。当然,高压缩率由于使用欧拉角,可以导致奇怪的重建路径。任何有损动作捕捉压缩方
7、法,基于取向或基于位置,介绍了错误,这些错误有可能引入各种视觉假象。最引人注目的是可能脚滑冰,极大地惩罚合成动作的视觉质量。这个假象使用逆运动学(IK)的技术加以纠正。然而,使用基于样式的 IK GMHP04通常被需要,为了更正运动,同时保留其视觉识别。2.2. 运动公制对于任何有损压缩系统,运动捕捉数据压缩的一个中心问题是用于评估结果的质量的错误的度量。在我们的情况中的问题是:度量应考虑到采取感知功能,这是一项艰巨的任务。虽然人们普遍认为 范数超过标记的位置是两个动画感性贴近的一个不牢靠的指标,很少工作提出替代方案(有可选的) ,高效的度量。RP03提出了一个错误用户的敏感性的研究,只考虑有
8、弹道导弹运动。尝试以评估动画的自然方面。这样做,3 类指标被区分:启发式规则,当违反(例如物理定律)惩罚动画得分被用户注意到的突出假象的感性度量(例如脚下滑冰)在大的数据集上测试的基于分类器度量前两个通常无法量化自然方面,或动画的风格,但在检测精确假象上做的很好。后者是基于这样一个假设:人们会感觉一个运动是自然的,如果它已经被看到很多次了。相反,一个不寻常的运动将被视为不自然。这些指标(这种度量)经常检测格式贴近成功,但高度依赖测试用的数据集。而且,本地物理异常或假象往往未被检测。事实上,寻找人体运动感知残余的准确和稳健的度量,以我们的知识,一个开放的问题。2.3. 非线性分析如前所述,压缩运
9、动数据的两个自然的方式是利时空相干性和相关骨架部分的运动。为了实现这一点,我们通常使用多分辨率和降维技术。虽然这些众所周知的理论框架对于一个线性空间中的数据(如小波变换,PCA(主成分分析))可用,将其推广到非线性空间(例如,空间旋转 SO(3) )是重要的并且是最近的研究领域。LS01为方位元素提出一个多分辨率方案,它允许编辑,混合和拼接的运动片段。压缩有一个潜在的应用,虽然并不发达。概括这方案为使用指数的和对数图的对称黎曼流形。使用插值方案可以看作是一个所谓的提升方案Swe98的特例。提升方案是定义小波的一个可选的方式,并在第 3.5 节被表述。提出一个飞机标题压缩的应用,并且有了可喜的成
10、果。降维问题,往往使用描述统计工具来解决。这些工具通常产生空间,更适合表达数据:小维,正交轴,最为显著。把线性统计工具扩展为非线性的情况是不轻松的,因为这个事实:许多在前环境情况的初步结果,当处理更多普遍空间时,不掌握。例如,找到数据的平均值的问题在一个球体上可以不再通过概率表示预期值,但诉诸最小化测地距离BF01。平均旋转落入这一问题类 Moa02。Pennec Pen06给出概率和统计的基本工具,在黎曼流形的总体框架上。弗莱彻FLJ03, FLPJ04提出了一种泛化 PCA 的某些非线性阀组名为首席大地测量学分析(PGA ) ,其中包括在寻找测地线,预计方差最大化。他还提出了一种近似分析,
11、归结在数据平均值得切线空间的标准 PCA。在 3.3 节有更多细节。算法在 SCLS07执行确切旋转 PGA,这表明,一个确切的重建所需的主要测地线的数量不是先验界。3. 提出的方法3.1. 动机 - 概述在本节中,我们给出动作捕捉数据压缩方法的概述。大多数人体运动压缩的方法利用全球标志位置实现压缩,然而这有一定的优势,如速度,和知名的框架的使用,最大的缺点是骨架的连续骨长度不能很容易得到保证,可以引入不受欢迎的四肢变形。这个约束需要事后处理通过被强制执行。然而,这个额外进程本身介绍假象。我们要通过工作方向,而不是立场来解决这个问题。然而,由于骨架的分层性质,即使在重建的方向的轻微的错误可能会
12、导致关节显著位置最终的错误。最显着的假象可能是脚滑冰,极大地惩罚了合成动画的感知质量。我们打算从动画剪辑建立一个姿势模型,来解决这个问题:这种模式将使我们合成姿势,匹配给定的关节约束,同时保持接近输入数据。一个姿势被定义为描述骨骼关节的方向旋转的向量。因此它是一个 元素,其中 nN 是骨架中关节数量。给定一个动作由 mN 个姿势组成,我们使用的主要测地线分析,以建立一个描述这些姿势数据的模型,只有保持最前面的主要测地线。然后用该模型在逆运动学系统合成姿势,这两个都匹配最终关节约束并且和输入数据接近。给定这些姿势模型,我们只需要存储压缩的最终关节轨迹以及根关节的位置和方向(也压缩) ,以恢复使用
13、的 IK 的动作。管道的压缩/解压缩如图1 。图1:管道压缩流图现在,我们简要地介绍了非线性工具,以及他们在我们的算法中的使用。3.2. Lie 群 - 指数映射立体旋转的空间是一个 Lie 群的特定的情况。一个 Lie 群是一组,这也是一个可微流形,对于它逆转和组操作时可微的。这种流形已被广泛研究并且在机器人被使用,来描述铰接机构 MSZ94 的配置空间。我们给在本文中使用的指数映射一个快速定义。对于一个完整的理论处理,见JJD00。设 G 是一个 Lie群。该指数映射是从 G 以身份(即 G 的李代数的,g)的切线的映射空间到组本身 G。对于每一个 Lie 子代数 Vg 的切向量,可以通过
14、 V 的左平移定义一个左不变向量场 ,让 作为这样一个向量场的唯一的最大积分曲线,然后指数映射通过 被定义。它是唯一的一个 G 的参数群,包括初始切向量 v,它是一个在0g 附近的微分同胚,逆映射被称为对数。在具有兼容黎曼结构的 Lie 群的情况下,如 SO(3) ) ,黎曼和 Lie 指数相吻合。这意味着我们可以计算测地曲线(即本地长度减少曲线) ,以及使用 Lie 指数测量这些曲线的长度。在最短的大地测量曲线(S)的长度在两点之间,被称为“测地距离” 。对于矩阵 Lie 群(即 的子群) ,指数通常由指数幂级数来定义。对于旋转,这一系列的总和被称为罗德里格斯公式Gra98。我们可以在组 g
15、G 的任何点定义一个指数映射,简单通过翻译(在本群里的操作意识)标准指数映射: 。在一个抽象流形比如 SO(3)的情况下,不能再定义一个元素的加权总和的平均值。相反,内在的平均值被定义为一个点,关于考虑到的所有点测地距离最小化。它可以通过优化算法(见FLJ03或Pen06)计算,使用指数映射并且通常在几个迭代中收敛。3.3. 主要测地线分析主要测地线分析是一个扩展弗莱彻介绍主成分分析FLJ03,FLPJ04。它的目标是描述 Lie 群的变化,可以给予黎曼结构和一个代数的兼容。这些群包括,以及任何他们之间直接产生的。 PGA 的背后的想法是以最大限度地提高预测的方差的方式,项目数据到测地线。在线
16、性的情况下,测地线是两点之间简单的线条,并且 PGA 归结为标准 PCA(主成分分析) 。当然,在一般情况下,在测地曲线上的投影不能被分析着定义,并且因此牵涉到一个最小化算法。为了避免这一点,弗莱彻建议近似投影到测地线,通过在切线空间的线性投影,在数据的内在平均值,在那个点使用指数映射。在这种近似情况下,主要测地线方向可以由一个标准的线性数据 PCA 来计算。事实上数据进行线性化意味着方便地保证其坐标不变性,但是也保证引起的失真最小。我们采用了 PGA 的框架来描述在一个运动中内节点方向的变化。然而,因为确切的 PGA 计算 (据我们所知)仍是一个开放的问题,我们用弗莱彻提出的近似计算主要测地
17、线的方向。这些测地线可以被看作在序列的骨架特征构成。我们不包括根关节的方向分析:的确,它与骨架的姿势相关性较差,在 PGA 和使用它可以改变结果主要测地线。如前所述,骨架的姿势被一个直接产品的矢量表示 ,n 是骨骼关节的数目。应用近似 PGA 到姿势数据,从一个具有 mN 的运动帧产量:内在的数据平均值, KN,切线方向 ,其中每个 唯一定义了一个测地线一套坐标 ,其中 , ,其中第 行是超过K 测地线的第 个姿势的近似的投影第 个姿势可以使用的 k 领先的测地线恢复部分:这些参数的近似姿势流形使用第二类的典型坐标(CCSK,见MSZ94) 。我们能想到的重建公式作为前 k 个特征姿势的加权组
18、成。请注意在这里,指数超过直接产品 被使用。主要测地线的例子从动作捕捉数据提取,图2 可以看出。图3所示,需要主要测地线的数量代表99的输入数据的方差一般不到20。对于具有较强的相关性的运动,如步行运动,在大多数情况下10个测地线足够表达95输入方差。通过只考虑 PGA 的第一模式,我们获得新的简化的运动的参数,根据测地线坐标。我们下一步展示:这样一个简化的姿势参数怎样被用来演示逆运动学。3.4. 基于 PGA 的逆运动学测地线坐标下的简化参数允许我们定义一个函数 ,它映射一套测地线坐标 到 末端效应器: 的全球空间位置。这个函数是简化的姿势参数化的组成,由 CCSK 和古典直接运动学函数,它
19、映射一个骨架姿势到 d 末端效应器的全球位置,。 g 在姿势 的衍生物简单映射了即时旋转向量,为每个关节的末端效应的线性速度。图2:使用 PGA,从一个霹雳舞的动作提取的主要测地线的两个例子。在这里,相应的姿势,给出了4种不同的测地坐标。左上图为平均姿势(零测地系数) 。由于 是在 Lie 群中可微函数(幂)的结果,因此,是可微的。每个 的偏导数关于 ,可以很容易地计算,因为 CCSK 参数化使用伴随的 Ad 映射,在 (见实例MSZ94第116页) 。我们最终能够计算整个函数 的雅可比矩阵 ,使用链式法则。然后,我们在最小二乘优化方法中使用这个雅可比,如作为知名的 Levenberg-Mar
20、quardt 算法,以便找到测地线坐标 ,最佳匹配给定的末端效应器的约束 :使用这种方法的好处有三: 优化在一个比传统的 IK(通常为30个自由度)更小的空间内被完成:这不只是加速了进程,也能更好地约束 IK 的问题。 测地线作为主要构成模式,优化自然地利用关节之间的相关性,以达到目标,导出一个更自然的姿势。 测地线公式化允许快速计算在优化中使用的雅可比 ,从而消除数值微分的需要。主要缺点是测地线可达空间有限:我们的 IK 在相邻输入数据中工作的更好。然而,因为我们只关心对输入数据恢复姿势,这不是一个真的问题。当然,我们使用更多的测地线,就能达到较大的空间。在我们的实验中,10-12模式一般足
21、以执行 IK,在4 个或5 个 IK 手柄一次。除了压缩,这个 IK 系统也可以被独立用于实时,如图4 交互运动编辑。图3:直方图显示为了实现给定的方差重建,需要的测地线数量,使用近似PGA 中。顶:整个 CMU(债务工具中央结算系统)数据库的99 的方差。底部:只有步行运动的95的方差。为了使用基于 PGA 的 IK 恢复动画序列,需要以下数据: 内部方向平均,k 领先主要的测地线 跨越时间的终关节轨迹 跨越时间的根关节的方向和位置要恢复每一帧,我们首先在根关节的框架中表示出终关节轨迹,然后像早先介绍的那样执行 IK。这样做,已经导致一个良好的数据压缩,因为我们只需要存储7条轨迹( 2个根关节, 5个终关节) ,而不是在原始动作中找到30条。当然,因为这些轨迹呈现出高度的时间相干性,我们将利用它进一步压缩的运动数据。