论文导读::应用于短信分类时。贝叶斯算法。短信的表示和特征提取。向量空间模型(VSM)。论文关键词:短信分类,贝叶斯算法,特征提取,向量空间模型1. 引言随着移动通信技术的飞速发展和手机普及率的迅速提高,手机短信逐渐成为人们日常生活中不可或缺的通信方式,然而,由于其低廉的传输代价,使得我们每天收到很多不请自来的垃圾短信,一般来说,凡是用户没有定制过的包含有欺骗、色情、诅咒等内容并且是用外地手机或小灵通为发送号码的短信,均为垃圾短信1。垃圾短信的常见内容包括广告信息、色情信息、假中奖信息、欺诈信息、恶作剧等,垃圾短信危害社会安全、毒害社会风气、影响用户的正常生活,目前,垃圾短信过滤技术主要借鉴垃圾邮件过滤中的成果,如黑白名单过滤、规则过滤和基于关键词过滤等技术。短信的主体内容仍然是由文本组成,因此对短信的分类就转化为对短信文本的分类,这里我们借鉴文本分类的过程对短信进行分类,分为正常短信和垃圾短信,并对不同类别的短信采取不同的处理办法。在文本分类算法中特征提取,贝叶斯方法拥有很多的优势,并且在垃圾邮件过滤方面取得了很好的成效。本文利用改进贝叶斯分类算法,对短信按照