序 列 报告人:熊 赟 内容概要 基本概念 其他 类Apriori生成候选算法 相似性搜索 FreeSpan算法,PrefixSpan算法第6章 序 列 6.1 基本概念 6.2 原 理 6.3 核心算法 6.4 其 他 n 序列是不同项集的有序排列。 n 定义1(序列):I=i 1 i 2 i m 是项集,i k ( 1=k=m)是一个项,序列S记为S, 其中s j (1=j=n)为项集(也称序列S的元素), 即s j I。每个元素由不同项组成。序列的元素可 表示为(i 1 i 2 i k ),若一个序列只有一个项,则 括号可以省略。 n 序列包含的所有项的个数称为序列的长度。长度 为l 的序列记为l -序列。 序 列n 定义2(子序列):序列T是另一个 序列S的子序列,满足下面条件: 对于每一个j,1=j=m-1,有i j i j+1 且 对于 每一个j,1=j=m,存在1=k=n,使得t ij s k 。即序列S包含序列T。用符号“”表示“被 包含于”,序列T是序列S的子序列可记为TS 。称T为S的子序列,S为T的超序列。 n 若一个序列S不包含在任何其他的序列之中,则 称序列S