1、分类号: TP391 单位代码: 10422 密级: 学 号: 201213167 户蒙力番 硕 士学位论文 Thesis for Master Degree 论文题目:基于多特征的人体骨架运动检索 MULT I-FEATURE BASED SKELETAL MOT 1 0N RETRI呲 作者姓名 周璐 培养 单 位计算机科学与技术学院 专业 名 称 计算机科学与技术 合作 导 师 指导 教师 彭京亮教授 201 5 年 6 月 30 日 万方数据 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他
2、个人或集体己经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均己在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者签名: !逖 El 期: “2,01fr调 关于学位论文使用授权的声明 本人同意学校保留或向国家有关部门或机构送交论文的印届 4 件 和 电子版,允许论文被查阅和借阅;本人授权山东大学可以将本学位 论 文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩 印 或其他复制手段保存论文和汇编本学位论文。 (保密论文在解密后应遵守此规定 )论文作者签名:碰导师签名: 万方数据 山东大学硕士学位论文 目 录 摘 !要 I ABSTRACT llI 第 l
3、 章绪论 1 1 1 研究背景 1 1 2 研究意义 1 13 本文创新 3 14 论文的组织结构 4 第 2 章相关工作 5 2 1 特征描述符的提取 5 2 2 降维 7 221 基于关键帧提取的降维 7 222 基于子空间的降维 8 2 3 相似性匹配 9 2 3 1 局部相似性匹配 9 2 3 2 全局相似性匹配 10 第 3章算法设计 11 3 1 多特征提取和描述 11 3 1 1 关节之间的夹角 13 3 1 2 关节点的点速度 13 3 1 3 平面之间的夹角 1 4 3 1 4 布尔型的关节点间位置关系 14 32 降维 1 6 3 2 1 主成分分析 (PCA) 16 3
4、2 2 K meRlls 聚类 1 8 3 2 3 运动直方图的构建 19 3 2 4 运动序列的匹配 20 第 4章结果与评估 22 万方数据 山东大学硕士学位论文 4 1 数据集 22 4 2 评价指标 23 4 3 实验和对比 24 第 5 章结论与展望 28 5 1结论 28 5 2展望 28 参考文献 3l 致 射 33 攻读学位期间发表的学术论文目录 34 攻读学位期间参与的科研项目 35 万方数据 山东大学硕士学位论文 CoNTENTS Chinese Abstract I English Abstract 。 ” “III Chapter 1 Introduction ! 1
5、11 Research Background 1 1 2 Research Goals 1 13 Innovations 3 1 4 Thesis S 臼 ?uctIJre 4 Chapter 2 Related Work 5 2 1 Feature Description Extraction 5 2 2 Dimension Reduction 7 221 Key Frame based Reduction 7 2 2 2 Subspace based Reduction 8 2 3 Similarity Matching 9 231 Partial Matching 9 232 Globa
6、l Matching 10 Chapter 3 Proposed Scheme 11 3 1 Multi Feature Extraction and Description 1 1 311 JointAngles 13 312 Joint Speeds 13 3 1 3 Plane Angles 1 14 3 1 4 Boolean Joint Relationship 1 14 3 2 Dimension Reduction 16 321 Principal Component Analysis 1 6 322 K means Clustering 1 8 323 Motion Histo
7、gram Construction 19 3 2 4 Similarity Matching 20 Chapter 4 Results and Evaluation 22 41 Data Set 22 4 2 Performance Metrics 23 4 3 Results and Comparisons 224 Chapter 5 Conclusion and Prospect 28 万方数据 山东大学硕士学位论文 :, 1 Conclusion : !; 5 2 Looking Forward 28 References 31 Acknowledgement 32 The Papers
8、 Published for the MasterS Degree 34 The Projects Participated for the MasterS Degree 35 万方数据 山东大学硕士学位论文 摘 要 近几年来,随着三维游戏一系列的创作产品不断地兴起,计算机不仅在在文 化创作 (例如广告设计、电影创作、动画特效 )、人机交互、游戏创作、广告娱 乐等应用中发挥着不可替代的影响,还广泛应用于教育事业以及国防建设、卫星 研发等科技领域。计算机图形学技术以及计算机软硬件的迅猛发展更是让计算机 有能力开发出这些产品,并且提供了更加便捷的途径。 随着大规模的三维人体运动数据库的不断建立,我
9、们需要从复杂的人体运动 序列中找到可以准确代表整个运动序列的属性描述符,需要对人体运动数据进行 高效合理地分析与处理,以及检索出符合用户需求的目标运动序列,这些工作都 是任 重而道远的。 我们针对基于多特征的人体骨架运动数据的检索提出了一种高效的解决方 案。 第一个主要的亮点在于我们利用不同的分步提取标准,从运动序列中提取并 描述 多种特征。另外,为了更加便利高效地进行特征匹配,我们通过主成分分析 法和聚 类分析法对特征描述符进行降维,并且利用多运动直方图来表示每种特征 中的一个 运动序列。最后,通过测度并排序查询序列和数据库中的目标序列的运 动直方图 的相似度,得到最终的检索结果。多次的对比
10、实验表明我们提出的算法 性能和效率 较为突出。 其中,我们工作的主要贡献在于以下四点: 1、运动数据的多种特征提取。考虑到人体骨 架的几何特征可以比较真实地 反映出运动的本质特性,因此选取四种具有代表性的几何特征来更加准确地描述 运动序列以提高检索的精确度。传统的二维几何特征提取只是显示三维人体骨架 运动的局部几何特征,但是在我们提出的基于多特征的人体骨架运动数据的检索 算法中提取基于三维空间的位置关系的特征是从全局的角度出发,来表示出人体 运动的几何特征。这样既可以有效精准地显示出每个关节点自身的独立运动特 征,又可以清楚明确地反映出各个关节点之间相互作用的运动特征。 2、运动特征描述符的降
11、维。由于我们提取出来的三维人体骨架运动特征描 述符的维数很高,为了避免所谓的维数灾难问题,达到精准的运动序列查询和检 索目的,本文通过主成分分析法和聚类分析法等技术对特征描述符进行降维来方 万方数据 山东大学硕士学位论文 便后续分析和处理,争取以最少的代价达到更高精度的特征匹配。 3、运动数据的特征匹配。 本文针对三维人体骨架运动数据进行降维、聚类 分析等预处理之后,提出来利用运动直方图来对处理结果进行分析表示,也就是 说 可以通过计算每个类别出现的频率建立出运动直方图,并求得两两直方图之间 的 欧氏距离来对查询序列和数据库中目标序列进行匹配和检索。 4、实验效果的评价测度。本文对查询序列和数
12、据库中的每一个目标序列的 运动直方图的相似度使用 MAP 和 Pn 的评价指标进行实验效果的度量,对检索 结 果的性能进行评判。 关键词:基于内容:多特征;骨架运动检索 万方数据 山东大学硕士学位论文 ABSTRACT As the production of 3D games are growing more and more quickly,computer science and technology plays an important role in many applications,just like computer animation , interactive virtua
13、l reality,film production and video game developmentWhatS more , computer is widely used in education , national defence and satellite research The increasing improvement of computer software and hardware provides a convenient way in developing these products for US With a vast amount of skeletal mo
14、tion data at hand , we need to fmd out the substitutive characteristics which Can describe the whole motion sequence well, to search for the data wanted accurately and efficiently,and retrieve the target motion sequence which users need In this work , we propose an effective scheme for contentbased
15、retrieval of skeletal motion dataThe first important novelty is that we extract and describe multiple features of the motion sequences , at various levels of semantic abstraction Furthermore , in order to facilitate efficient feature matching , we reduce the dimensionality of the feature descriptors
16、 through principal component analysis and cluster analysis , and concisely represent a motion sequence by multiple motion histograms, one for each feature Finally,the retrieval is achieved by measuring and sorting the similarity between the motion histograms of the query and those of the motion sequ
17、ences in the databaseOutstanding performance of the proposed algorithm is well demonstrated by experiments nle main contribution we make in this work Can be described as follows , l、 Multi feature extraction of motion data Different from the traditional single motion feature extraction methods , we
18、comprehensively consider the geometrical characteristics of the human body skeletal structure which Can more truly reflect the intrinsic properties of the movement , and select four representative geometrical characteristics to describe the motion sequence more accurately in order to improve the ret
19、rieval precision 2D geometric features Can only describe local geometric structure of the movement well , while three dimensional space time characteristics we extracted in this paper are based on spatial location relationships , they Can effectively express the independence movement information of
20、the joint points , and reflect the interaction of movement properties III 万方数据 山东大学硕士学位论文 from the perspective of the global geometric structure 2、 Dimensionality reduction of feature descriptors Due to the dimension extracted from movement characteristics is large , SO we reduce the dimensionality
21、of the feature descriptors through principal component analysis and cluster analysis , in order to avoid dimension disaster and for higher accuracy 、加 t11 least cost of feature matching 3、 Feature matching of motion data In order to adapt to the needs of large-scale database , we propose the present
22、ation of motion histogram after preprocessing the motion data 、加 t11 dimensional reduction and cluster analysis , and build the histogram after computing the occurring frequency of each category At last , we compute the Euclidean distance between any two histograms in order to match the query sequen
23、ce and target sequence in the database 4、 Evaluation metric of experimental results We propose two metrics MAP and an to evaluate the similarity between the query sequence and target sequence in the database Keywords : contentbased, multifeature, skeletal motion retrieva 万方数据 山东大学硕士学位论文 第 1 章绪论 1 1
24、研究 背景 近几年来,随着三维游戏一系列的创作产品不断地兴起,计算机不仅在在文 化创作 (例如广告设计、电影创作、动画特效 )、人机交互、游戏创作、广告娱 乐等 应用中发挥着不可替代的影响,还广泛应用于教育事业以及国防建设、卫星 研发等 科技领域。计算机图形学技术以及计算机软硬件的迅猛发展更是让计算机 有能力 开发出这些产品,并且提供了更加便捷的途径。 12 研究意 义 自二十世纪七十年代以来,人体运动捕捉技术对捕获到的运动数据可以进行 采集与实时处理,得到的结果与原始数据具有高度的保真度效果,因而可以被用 来创作出具有高度仿真并且高效率优点的人体动画产品,并且在计算机动画领域 得到了极大的推
25、广。近几年来人体骨架运动数据的相关检索技术已经开始成为计 算机动画和图形学领域的研究热门话题,而且随着计算机硬件和软件设备以及相 关技术的快速发展,研究学者通过使用一系列的运动捕捉设备,能够获得大量的 三 维人体骨架运动数据信息,对这些捕获数据进行系统分析和处理,随后根据这 些处理 后的信息创建一个大型的三维骨架运动数据库,最终根据电影制作、大型 互联网 游戏的开发以及计算机交互仿真技术的不同需求制作出相应的动画产品。 由于大量 三维人体骨架运动的捕捉数据能够简单地获取到,从而会致使很轻 松容易地建立一系列大型的人体骨架数据库,这对动画的制作效率具有很大的影 响。 与此同时,捕获到的三维人体运
26、动信息虽然可以提供多样的动画制作原材料, 但是 因为缺少体现本质结构的信息而且自身信息冗余、帧速率较快,所以人们对 此类三 维骨架数据的编辑、合成以及重用等需求很难达到原始期望。如何高效、 合理地分 析并处理这些三维人体骨架的运动数据库,并且从中获取所需的运动数 据,进而实 现对动画产品的创作,这对于大规模三维人体骨架运动捕获数据库的 建立有着非 常重要的价值,也受到了越来越多的国内外相关领域学者的重视。 与文本、图像、音视频等常见的检索对象一样,运动数据的检索也分为两种 检索方式:基于人工标注的检索方式和基于内容的检索方式。由于人工标注是低 万方数据 山东大学硕士学位论文 效率的,而且文本标
27、注不会充分地描述并解析文本内容,对运动数据本身的特征 关 注比较少,因此检索结果会差强人意,所以这种基于文本标注的方法不符合社 会需 求。相反,基于内容的检索是从三维人体骨架数据本身作为出发点,针对三 维人体 骨架数据所包含的运动相关信息进行处理,自动提取出能够充分描述运动 信息的多 维特征,最终通过度量目标运动序列和运动序列数据库之间的特征相似 性进行检索 和匹配,所以目前基于内容的检索技术被研究学者推广到各个领域。 基于内容的检索 技术如今已经作为多媒体和计算机动画领域研究的热门技 术,而且在图像、音 频、视频等信息处理领域有着极大的使用前景和潜力。这项 技术一般会通过提取色 泽、外形、纹
28、理、声音和运动等基本特点来表示出多媒体 内容的语义信息,然后根据 数据库存储的特征信息与用户提供的检索实例的特征 信息进行匹配,最终实现相近 的运动序列的检索。虽然基于内容的三维检索技术 在检索效率和检索精确度方面优 于传统的检索技术,然而目前在检索人体运动的 领域还需要更加高效精准的技术,所以该领域的研究任务依然很艰巨。 图 1-1 为基于内容的检索技术的常见流程图,其中该项技术的难点在于如 何 高效地提取运动数据的特征描述符、如何准确地进行相似性度量。 运动数据库 查询运动数据 r : !|! 特征提取 特征提取 I 一 、 运动特征库 查询运动特征 相似性匹配 丫 :检索结果 j 图卜
29、1 基于内容的检索工作流程图 综上所述,目前基于人体骨架的三维运动检索技术还缺少较为完善的处理技 术。首先,缺乏针对人体几何结构和三维运动数据的有效特征描述符,无法准确 地提取能完全代表该运动序列的特征信息;第二,这些技术都还没将真正高效的 万方数据 山东大学硕士学位论文 降维算法应用在三维人体骨架的运动数据上,导致运动数据的 “维数灾难 问题 还 没有得到实际地解决,而且计算量和复杂程度都很高,从而很难被广泛地应用 到 实际生活中;第三,目前针对大型的三维人体动作数据库,依然缺少精准高效 的 查询及检索机制,研究工作任重道远。 13 本文创 新 基于多特征的人体骨架运动检索的这些技术性问题,
30、本文主要目标是准确全 面地 提取足以代表三维人体骨架运动信息的多维特征,并且不失真地对人体运动 数据进行 降维操作,以及对数据库中的运动序列进行匹配和检索,最终针对基于 内容的人体骨 架运动数据的检索提出了一种高效的解决方案。主要完成了以下工 作: 1、运动数据的多种特征提取。考虑到人体骨架的几何特征可以比较真实地 反映出运动的本质特性,因此选取四种具有代表性的几何特征来更加准确地描述 运动序列以提高检索的精确度。传统的二维几何特征提取算法只是可以表示三维 人体骨架运动的局部几何特征,然而在我们提出的算法中提取出来的基于三维空 间 的位置关系的时空特征是从全局的角度,可以表示出人体运动的三维几
31、何结构 特征。 这样既可以有效精准地显示出每个骨骼点自身的独立运动特征,又可以清 楚明确地 反映出各个骨骼点之间相互作用的运动特征。 2、运动特征描述符的降维。由于提取出来的特征描述符的维数比较高,为 了避免产生维数灾难的问题,并且达到高效精准的特征匹配和运动序列的检索目 标, 本文通过主成分分析法和聚类分析法等技术对特征描述符进行降维以方便后 续分 析和处理,争取以最少的代价达到更高精度的特征匹配。 3、运动数据的特征匹配。考虑到人体运动数据库规模比较大的情况,在对 三维人体运动数据进行合理降维、聚类分析等预处理之后,我们提出一种运动直 方图的表示方法:通过计算每个类别出现频率构建直方图,并
32、求得两两直方图之 间 的欧氏距离来对查询序列和数据库中目标序列进行匹配和检索。 4、实验效果的评价测度。本文对查询候选运动序列和运动数据库里的每一 个目标运动序列的运动直方图的相似度使用 MAP 和 Pn 的评价指标进行实验效 果 的度量,对检索结果的性能进行评判。 万方数据 山东大学硕士学位论文 本文针对基于内容的骨架运动数据的检索提出了一种高效的解决方案。文章 结构主要组织为以下几部分。 在第一章中,提出该工作的研究背景、研究意义、本文创新以及文章的组织 结构。 在第二章中,简要地浏览一下近期有关基于内容的骨架运动检索的研究工 作。根据目前主要的研究问题一一特征提取和数据降维,对相关工作进
33、行了较为 详 细的阐述和透彻的分析。 在第三章中,主要介绍了目前人体骨架运动检索相关工作的背景知识。 在第四章中,首 先阐述了从三维人体骨架的运动数据中提取具有代表性的特 征描述符的算法,并列出四种具有时空特性的特征描述符;然后介绍了利用主成 分 分析法和聚类分析法等技术对高维人体运动特征描述符进行降维;最后提出利 用运 动直方图对查询候选运动序列和目标运动序列进行索引和匹配操作。 在第五章中,通过 MAP 等通用评价指标对检索结果进行有效的测度,并加入 另外两项工作与我们的算法进行对比分析。 在第六章中,提出 本论文的工作总结和未来展望。 4 万方数据 山东大学硕士学位论文 第 2 章相关工
34、作 在本文中,我们主要从以下几点进行研究和讨论: l、根据人体工程学可知,人体自身 结构比较复杂,导致捕获的运动数据信 息也会繁琐,如何从这些信息中提取出能尽可能全面地表示出整个人体运动的本 质特征描述符将会是工作中的重中之重; 2、由于提取出来的特征描述符的维数比较高,为 了避免产生维数灾难的问 题,并且达到高效精准的特征匹配和运动序列的检索目标,需要对这些数据进行 有效的降维; 3、降维之后,针对大规模的三维人体运动数据库,如何进行准确、实时地 匹配和检索也是核心问题; 4、对于检索结果反馈机制和评价指标的选取。 针对基于内容的三维人体骨架运动的检索, 最重要的问题是如何来描述一个 运动序
35、列的特征属性。特征描述符自己的规模可以很庞大,针对描述符的降维操 作对于高效检索来讲也非常关键。在下面的章节里,我们会简单浏览一下特征描 述符的提取和被不同骨架运动检索算法所采纳的降维方法的相关工作。 21 特征描述符的提取 众所周知,一个人体基本运动姿势的特征提取一般都是从人的骨骼点上着 手,包括骨骼之间的夹角、骨骼点的点速度、骨骼所在平面之间的夹角和骨骼点 的布 尔型位置关系等数据信息,获得的这些运动数据都是高维的。根据运动捕捉 数据 的特征,目前有一些基于低阶的运动序列特征描述符的算法。 Liu1 运用了父节点的运动影响子节点的运动而反过来子节点的运动不影响 父 节点的运动这一原理,把动
36、作库分成一系列的运动检索子集,采用层次化运动 模 型将人体的骨骼点分为五层,再用动态聚类的这种新兴算法建立起对应运动索 引 树 (Motion Tree) ,树的更深层对应更深的骨骼结构关节,即检索树的叶节点。 Lin2等人将提出的基于骨骼几何特征的运动索引方法,应用在大型的三维 人体骨架运动数据库的查询与检索中。他首先在基于检索的几何特征描述符中定 义了一个类似于人体骨骼结构的几何特征索引树型结构。然后根据人体的几何属 万方数据 山东大学硕士学位论文 性来分割运动序列,让相近的动作片段作为树的叶子节点,再设定出一种所谓的 特征 编码函数,该函数能够实现特征描述符的提取和描述,接下来利用曲线匹
37、配 算法 实现出相似的三维人体骨架运动序列的查询与检索。 Xiao3 提出了一种层次化曲线简化的算法来进行运动检索,其中该算法用到 了骨骼之间的夹角作为运动特征描述符。 Pan41 运用人体的四肢和中间的脊骨之 间的夹角来描述运动特征。Worawat5提出一种简化查询的快速滤波算法,其中 也是用到关节之间的夹角作为基本的运动特征描述符。 还有一些其他的算法是基于高阶的运动特征的提取和描述。比如, Muller6】 介绍了一类描述固定人体姿势的骨骼点之间几何逻辑关系的布尔特征,然后针对 获取到的这些特征进行分析和归纳,总结出人体运动序列信息的时间段。在几何 特征提取的基础上, Muller7 提
38、出运动模板 (MT)的概念,他定义了 MT 就是从 同类 的人体运动数据中提取出的、用布尔值表示的特征矩阵,而且为特定的人体 运动 集学习出相应的模板匹配未知的运动序列,通过和运动模板的对比来自动获 得未 知运动的各个特性。该 MT 算法的本质在于可以从逻辑相关的同类运动中提 取出特征矩阵,该算法主要应用于三维人体运动数据的查询与检索方面。 Chiu8 通过人体工程学原理把人的身体结构划分为一个根骨架和八个主要 骨架,即包含左右前臂、左右上臂、左右小腿、左右大腿和躯干这九个部分。其 中各个骨架都有相应的动作,还能够构成每个骨架的索引结构。然后仿射不变的 姿 势特征里利用自组织映射聚类方法 (S
39、OM) 来构建索引表,索引表表示人体所有 姿势的分布特征,相似的姿势可以被映射到相同或相邻的类中。在索引过程中, Chiu 等人提出仿射不变的姿势属性,然后基于原始数据的姿势分布又构造出了 一种索引图结构。在匹配过程中,运动序列的起始帧和结束帧开始被编入索引图 结构中,以在三维人体运动数据库中选取一些概率较高的备用片段,最后通过动 态时间卷曲算法 (DTW) 计算检索候选运动片段与所有备选运动片段的匹配度。 Xiang9构建了一种双基准指数 (D) ,它基于对人体关节点和一小部分具 有代表性的运动序列之间的几何关系的分析。 总体而言,低阶特征描述符在捕捉细节上比高阶 特征描述符更胜一筹,而高
40、阶在捕捉整体运动语义上面更好一些。 万方数据 山东大学硕士学位论文 2 2降 维 如今科技飞速发展,人们常需要对大规模数据和信息进行分析处理,而这些 数据和信息之间 常常会有着严重的冗余。因此需要合理地利用、分析这些数据, 并且找到数据之间存在的内在关 联,从而有效地降低维度,并能够提取出隐含却 有用的信息,这些技术也已经逐渐作为计算机 各大主流领域 (比如机器学习、数 据挖掘、动画创作、模式识别和信息检索等 )的热点。 原始运动特征描述符经常是高维存在的,在机器学习中被称为“维数灾难”, 其实这些高维数据之间都会存在严重的信息冗余问题。因此我们需要在进行高效 检索之前寻找数据间的内在联系,对
41、它们的维度进行一些必要的降低,消除数据 之 间的冗余问题,将数据从一个高维空间映射到相应的低维空间中去。下面介绍 的一些 算法就是己经应用于人体运动数据检索的代表性降维算法。 2 2 1 基于关键帧提取的降维 如果直接对人体运动数据这类复杂的时序数据进行降维处理不是 很轻松,尤 其是在早期线性降维方法作为主流,很难将主成分分析方法 (PCA)直接应用于 三维人体骨骼运动数据的降维操作中,因此一般来讲会直接对这类复杂的时序数 据采 用提取关键帧的算法,从完整的运动序列中提取少量具有代表性的关键帧来 表示 出整个运动序列,从而间接地完成了人体运动序列的降维操作。 与二维时序视频数据中的关键帧不同,
42、提取关键帧的算法是一种经常应用于 计算机检索相关 领域的技术。当今主流的人体运动数据的关键帧提取方法有两 类:等间隔采样,自适应采样。等 间隔采样在运动比较激烈的部分采样量过少, 从而会丢失一部分人体运动的细节;而在运动平缓 的部分采样过量,会导致运动 信息的过度冗余。相反,自适应采样便完美地处理了这个棘手 难题。 Liu1为了引用自适应采样原理,专门提出了一种基于聚类的关键帧提取算 法:他把 N 帧运动数据聚类到 K 个群中,取出来每一个群中的第一帧作为关键 帧,并且提出一种阈值来判断当前的运动帧是不是属于现有的集群。 沈军行【10把人体各关节上旋转变化量作为帧间距,然后逐帧比较帧间隔的 变
43、化值来找到关键帧,即通过判断当前帧与关键帧集中末帧的距离是否大于特定 的 阈值来判断当前帧是否能够作为关键帧。为提高检索性能, Baak11基于 Muller6qb 的算法从几何特征中提取出关键帧。 万方数据 山东大学硕士学位论文 Xiao3 首先选出备用关键帧,然后利用分层曲线简化算法来筛出备用关键 帧, 从而提取出目标的关键帧。Pan4拓展了曲线简化算法,将初始三维人体骨 骼运 动数据中的任何一帧当作是高维空间中的某个点,然后依次连接全部数据 点,可以把初始运动序列描绘成一段曲线,最终采用曲线简化算法提取出关键帧。 以上这些自适应 关键帧的提取算法可以集中体现在两个比较重要的部分:运 动特
44、征描述符的提取,量化分析关键 帧提取算法。其实这些关键帧提取算法仅仅 压缩了数据量,而没有对它们进行有效的处理,因 此依然没有彻底降低数据的高 维度,也没有解决数据的冗余问题,所以我们需要提出一种彻底 高效的降维方法 应用在三维人体运动数据的处理上。 222 基于子空问的降维 基于子空间的降维算法的历史较长,在二十世纪四十年代学者便引入 K L 变换,其中 K L 变换是在线性条件下所达到的最优变换, PCA 便是起源于此。 由于 PCA 算法计算复杂性 低,而且可以去掉数据相关性和噪点。在 PCA 算法提 出之后又有不少子空间方法被陆续提出, 比如 FLA、 ICA 等,这些算法的原理基 本
45、是将高维数据投影到一个满足特定准则的最优子空间 中,最终将这些高维数据 的维数进行了高效精准地降低。 一般的降维算法基本上都类似于 FLA 、 ICA 这样的算法原 理来进行降维操 作。然而近几年,非线性降维算法开始出现并引起广泛关注,如非线性流形学习 的方法, aO 幂 tJ 用非线性流形的特点来对高维数据降维。 LLE 算法由 Roweis 等人 【12】 提出,他们规定在保存相邻数据点之间关系 的 前提下,使高维原始数据点投影在一个全局低维的坐标系上,如此便可以保 留下 特定的几何结构特征。 Chiu8 应用自组织映射 (SOM) 来将全部骨架的高维姿势特征分解到一组 分段骨架的低维姿势
46、特征中。 Worawat5 提出一种叫做平均方差的常数近似值 (CAAV) 的新的降维算法,而且基于快速滤波的非线性匹配算法动态时间弯曲 (DTW) 来进行匹配。 Tenenbaum 等人提出了 Isomap 算法 1 3】 ,该 Isomap 算法开始的时候使用 最 近邻中最短路径得到相似的测地线距离,再将得到的数据输入到多维尺度分 析 (MDS) 中进行分析,最终会从高维空间中获取到内置的低维坐标信息。 万方数据 山东大学硕士学位论文 Donoho14 用 Isomap 算法对人工合成的三维人体运动数据进行测试,最终发现 Isomap 能够准确 计算出图像流形潜在的参数空间。与此同时,Xi
47、ang9便基于该 非线性降维方法 Isomap 对运动数 据降维并且提取特征。目前为止无论是在算法 思路还是在数据本身特性上,流形学习与之相关的 算法都依然具有一定的局限性 和缺陷短板。根据以往研究经验来看,流行学习算法的试验效果与算法的 收敛速 度高低、目标结果的分布范围和算法内在假设的合理性都有着密不可分的关系。 总而言之, 目前的非线性降维技术的原理一般是为了获取流行学习的内在组 织结构,在对所有数据点的特征属 性并不知情的情况下进行操作,也就是无监督 的非线性降维技术。同样,该项技术也适用于目前热门 的的三维人体骨架运动数 据库的降维操作。 23 相似性匹 配 在完成了数据库的索引之后
48、,最终还要对选出来的一些数据进行相似度的计 算并进行查询和匹配操作,才能完成整个索引的过程。相似性匹配由局部相似性 匹 配和全局相似性匹配构成,各自能够检索现有的数值相似运动序列和逻辑相似 运动 序列。惯常的做法是先通过局部相似性匹配计算出三维人体骨架运动序列之 间的数 值相似性,接下来利用全局相似性匹配根据所得到的计算结果确定出运动 的逻辑 相似性,最终可以度量出两个运动序列之间的相似性。 231 局部相似性匹 配 局部相似性匹配根据现有的距离函数判断出不同三维人体骨架运动相对应 的姿势之间的相似性。 Kovar15首先通过线性变换方法对候选运动序列的位置 坐标以及数据库中的运动序列的位置坐标进行对齐操作,目的是为了将误差降低 到最小;为了避免运动噪声的干扰, Kovar 等人接下来利用已有的窗口距离算 法 来构造运动匹配网格。 Muller7 先是定义了几类能够保持空间不变性的几何特征 描述符,接下来将自适应运动分割算法应用在这些几何特征描述符上面,最终可 以 达到这些几何特征描述符具有时