基因预测原理介绍基础概念:随机过程:一族无穷多个、相互有关联的随机变量。记为:&(t),tGT由于参数t经常代表时间,故称为随机过程。T常为自然数,整数或区间。当参数取值为整数时,也称为随机序列。马尔可夫过程:取值为整数的随机过程,若t=i时刻的取值只与时刻i-1取值有关,则称为马尔可夫过程,亦称为一阶马尔可夫链。(丁f兀,T,fc隐马尔可夫模型:存在一个隐序列H,它是不可观测的,且由以下参数生成:a邓I门其中na为初始状态出现概率;Ta0为转移概率,即ta0=P(hi=pIhi-1=a);a,p属于O;O为字符集,即隐序列由哪些字符组成。观测的结果称为明序列O,它由隐序列按照生成概率eaa生成。其中eaa=P(aIa);fa为明序列字符集。隐马氏模型的三种典型问题:可能性问题:给定模型参数,当观察到一个明序列时,这一明序列确实由给定模型生成的概率有多大?解码问题:给定模型参数,当观察到一个明序列时,这一明序列所对应的最可能的隐序列是什么?学习问题:观察到足够多明序列时,如何估计转移概率和生成概率(有的地方叫发射概率)?