乳腺癌的诊断乳腺癌的诊断 a.问题描述现有500个乳腺癌病患的10个特征量的平均值、标准差和最大值以及其诊断结果-良性或恶性,并有69位待判断的乳腺癌患者的相关数据及其诊断结果,建立一个数学模型使得其能够由前500个病患的数据来给出后69个病患的诊断结果。b.分析调研1.整体评估将前500个数据存入数组,作如下处理:并将诊断为良性和恶性的数据分开,将这两个数组转制后作黑白图,如下: 恶性良性其中横坐标表示病例,纵坐标代表各项相关数据,颜色越深表示数值越低,可见良性与恶性的数据总体差异较大,但存在一些难以分别的病例。而且标准差的干扰最大。如果才用线性或logistic模型来分类,其分界界面为一个光滑平缓的曲面,这只能满足总体效果,对于一些局部区域的分界性能将不能够随着参考数据的增加而提升。为了进一步提高判断的准确率,需要重点识别由数据确定的分解区域。2. 二维投影分析将500个已知案例投影在任意两维中,并对每一维的数据采用如下归一化:选取其中具有代表性的数据结果。