基于SVM模型的文本分类研究1Perceptron与SVM概念介绍1.1感知机(Perceptron)感知机(perceptron)1957年由Rosenblatt提出,是神经网络与支持向量机的基础囹感知机,是二类分类的线性分类模型,其输入为样本的特征向量,输出为样本的类别出为样本的类别,取+1和-1二值,即通过某样本的特征即通过某样本的特征,就可以准确判断该样本属于哪一类。感知机能够解决的问题首先要求特征空间是线性可分的,再者是二类分类,即将样本分为+1,-1两类。由输入空间到输出空间的符号函数f(x)=sign(yvx+b)其中,w和b为感知机参数,w为权值(weight),b为偏置(bias)。.z八/十l,w兀十方20si訓w汨初”_5卄此0在感知机的定义中,线性方程对应于问题空间中的1个超平面(二维空间中为直线)S,位于这个超平面两侧的样本分别被归为两类,例如下图,红色作为一类(正类),蓝色作为w,b,这里x和y分别是特征向量和类别(也称为目标)。基于此,感知机模型可以对新的输入样本进行分类。1.2支持向量机(SVM