1、基于跨物种本体匹配的 致病基因预测 姓名 : 学号 : 指导教师 : 答辩提纲 课题背景 工作内容 算法设计 算法实现 算法分析 课题背景 跨物种 动物模型 工作内容 本体映射 人类表型本体( HPO) 哺乳动物表型本体( MP) 基因预测及排序 Lexical OWL Ontology Matcher, LOOM MP 算法设计 基因预测过程 算法实现 处理本体数据 Term id: HP:0000010 name: Recurrent urinary tract infections def: “Repeated infections of the urinary tract.“HPO:c
2、urators synonym: “Frequent urinary tract infections“ EXACT synonym: “Urinary infection“ EXACT synonym: “Urinary tract infection“ EXACT synonym: “Urinary tract infections“ EXACT xref: UMLS:C0042029 “Infections, Urinary Tract“ xref: UMLS:C0262655 “Recurrent urinary tract infections“ is_a: HP:0002719 !
3、 Recurrent infections is_a: HP:0100577 ! Urinary bladder inflammation 流程图 开 始开 始以 冒 号 分 割以 冒 号 分 割读 取 一 行 字符 串保 存 n a m e保 存 i d以 引 号 分割以 引 号 分割M P O S Y N O N Y M. x m lI f 分 割 数 目 1第 一 个 字符 串 是 i dM P O T E R M .x m lN OY E SY E SN O开 始结 束结 束合 并 后 面 的 字 符串 为 一 个 字 符 串合 并 后 面 的 字 符串 为 一 个 字 符 串第 一
4、个 字 符串 是 n a m eY E S第 一 个 字 符串 是 s y n o n y mY E SN OY E SN O算法实现 Algorithm LOOM () 1 get Terms of HPO 2 get synonyms of HPO Term 3 get Terms of MP 4 get synonyms of MP Term 5 Preprocess all the strings 6 if ( HPO Term or synonyms MATCH MP Term or synonyms ) 7 keep this record 8 return 1.比较两个字符串,若长度小于 4, 则两个字符串 完全相等 时 匹配 否则,求两者的 最长公共子串 2.比较公共子串与较短字符串长度, 若是 相差不大于 1,则 匹配 。 算法实现 H P O表 型 1表 型 2表 型 n.M P表 型 a表 型 b表 型 k.人类疾病 D DiseaseToPhenotype.rda HPOToMPO.rda 小鼠基因 人类基因 同源基因 GeneToPhenotype.rda PhenotypeToGene.rda