1、SPSS 软件技术需求文档一、采购需求产品名称:数据挖掘类软件品牌:SPSS基本描述:SPSS Modeler 14.1 Client 1Named User 产地:中国数量:1 套介质:光盘介质及手册二、产品技术要求1、要求软件具有较高的权威性,分析结果能在国际上得到认可。2、软件的易用性:a) 要求软件操作界面友好,提供全中文的操作界面,支持图形化界面、菜单驱动、拖拉拽式的操作;b) 挖掘流程易于管理,软件具有很好的数据挖掘文档、过程管理功能,支持业务理解、数据理解、数据准备、构建模型、评估模型和发布模型的 CRISP-DM 过程(即跨行业的数据挖掘标准流程 CRISP-DM:Cross
2、Industry Standard Process for Data-mining) ;c) 完善的帮助功能,具有详细的、便于使用和理解的中文帮助文档;d) 软件适合对数据挖掘了解程度不同的用户使用,提供专家模式和普通模式;3、软件的开放性:要求软件可以读取不同的数据源,如平面文件、Microsoft Excel;对主流数据库系统有良好的支持,如Oracle、DB2、Sybase 、SQL 等,能充分利用数据库管理系统自身的数据管理和运算能力,如数据库索引和优化等操作,并能结合自身的处理能力,使预测分析能力最大化;并能把输出结果保存为多种存储格式,如平面文件、Microsoft Excel 和
3、关系数据库。4、数据处理能力:要求软件能对数据进行多种复杂的转换,如排序、汇总、合并、抽样(简单、复杂抽样) 、平衡、重新分类等。 5、数据探索功能:要求软件提供丰富的数据探索功能和图形展现方式,可以生成散点图、时间散点图、分布图、直方图、堆积图、网络图等等。6、丰富的数据挖掘算法:a) 预测模型,包括神经网络算法(多层感知器和径向基函数) 、四个不同的规则归纳算法(C5.0、 CHAID、QUEST、C&RT) 、线性回归和Logistic 回归算法(进入、逐步筛选、前进、后退) 、一个序列探测算法、贝叶斯网络、决策列表、自学习响应算法、时间序列算法、判别式算法、广义线性算法等;b) 聚类算
4、法,包括 Kohonen 网络、K-means 聚类、两步聚类;c) 关联分析,包括 Apriori 算法和 Carma 算法;d) 探索模型及异常算法,具体包括异常分析、特征选择算法和主成分分析算法等;7、模型的稳定性及可靠性a) 支持 bagging 和 bootstraping 技术;b) 具有多模型整合能力;8、模型评估:具有对数据挖掘结果的评估功能。包括:收益图表、提升图表、投资回报图表、利润图表、响应图表。9、集成和部署能力:要求软件生成的模型能够导出成 SQL 语句或者PMML(XML 的一个变种)格式文件集成于其它应用系统中;也可以把整个数据建模流程导出,供应用系统(C+或 J
5、ava 程序)进行调用,实现数据建模流程脱离软件系统环境集成到应用系统中去。10、软件架构:要求软件采用 C/S 结构,客户端产品既能够作为独立的产品在本地运行,也能与 Server 一起以分布式方式运行,从而提高大数据集的执行效率。服务器端能够与一个或多个客户端以分布式方式安装。11、软件性能:要求软件具有并行、多线程处理能力,提供优化机制以保障在海量数据和大规模计算时的性能。三、服务要求1、软件购买后,可永久使用。提供一年内免费享受原厂商技术支持、软件升级服务。2、服务承诺:提供原厂商的产品介质及纸质永久授权 License。3、提供原厂商技术人员现场安装调试服务。4、提供两天上门培训服务,12 个月 PPA 服务。四、供应商资质要求1、法人营业执照的复印件(须加盖本单位公章) ;2、税务登记证书复印件(须加盖本单位公章) ;3、组织机构代码证复印件(须加盖本单位公章) ;4、原厂商正式授权的经销商或代理商,并提供正规进货渠道说明;5、必须提供原厂商出具的授权函及售后服务承诺函。