基于LDA模型的文档生成算法李晨(西安电子科技大学电子工程学院,陕西西安710071)摘要:本文包份两部分内容,一部分是我们对LDA様型的理解丄DA棧型的核心是对参纵5卩的估计,而估计过程用到了EM,variationalinference等方法对4,0进行违近,殺后收敛得出学习結果。另一部分是在此来赴上所做的文档生成様型,这个生成棧型的核心爱对参救&=(&雄仇)(k代表主题个数)的采样,我们利用Dirichlet分布与Gamtm分布的关系先产生k个相互独立的麻从Gamma分布的隨机救,再利用(9=.)=Dirichlet分布的&眾后利用函数Viy2SVi1=11=1SPkk=lnZpkk=l1=1,2,T对各个主题和单诃进行采样,戏终得出儿篇文档,经分析,生成的文档具有一定的意义。关键词:LDA型文档巳M算法DocumentgenerationalgorithmbasedonLDAmodelChenLi(SchoolofElectronicEngineering,XidianUniv.,