1、填空题:1、解决过度拟合问题通常采用剪树枝方法,剪枝是一种克服噪声的技术,同时简化决策树。在构造决策树时,不再对不纯的训练子集进一步划分的剪枝方法叫做(预剪枝 ) ;在树完全生成后进行剪枝的策略叫做(后剪枝) 。2、在多指标决策是一类特殊的多目标决策问题,主要是决策者基于多个指标对有限方案的评价和排序问题,考虑如何在已确定的方案中进行选优。其中:有的指标值越大越好的称为( 效益型指标)有的指标值越小越好 (成本型指标)指标值越接近某一固定值越优的指标(固定型指标) 。指标值越接近某一区间越优的指标称作(区间型指标) 。3、目前常用的标准化方法有(向量归一化法) 、 (线性比例变换法) 、 (极
2、差变换法)等。 其中(极差变换法)是使用最多的标准化方法。4、求一个向量的单位向量的过程,叫做(向量的归一化) 。它的运算法则为:对于一个非零向量 V,可以用该向量除以它的大小(或模)即可得到。5、该公式于 1763 年由 Bayes 给出. 它是在观察到事件 B 已发生的条件下,寻找导致 B 发生的每个原因的概率.称为( ) 。6、决策指标权重的确定的方法有(德尔菲法) 、 (相对比较法) 、 (熵值法) 。7、 (德菲尔法(Delphi Technique)),即函询调查法,将提出的问题和必要的背景材料,用通信的方式向有经验的专家提出,然后把他们答复的意见进行综合, 再反馈给他们,如此反复
3、多次,直到认为合适的意见为止。8、 (主观赋权法):根据决策者主观经验和判断,用某种特定法则确定权重的方法。缺点:赋权法依赖经验和判断,带有一定主观性。(客观赋权法):根据决策矩阵中评价指标携带的客观信息,用某种特定法则确定指标权重的方法,称为客观赋权法。 缺点:客观赋权法虽然依据客观指标信息,但指标信息数据的采集难免受到随机干扰,在一定程度上影响其真实可靠性。 两种赋权方法各有利弊,实际应用中应该有机结合。9、 (权重)是各指标重要程度关系的定量表示。合理确定和适当调整指标权重,可以在决策过程中体现各评价指标轻重有度、主次有别,增加评价指标之间的相互可比性。10、 (熵值法)是一种客观赋权法
4、,依据各指标值所包含的信息量的大小来确定指标权重。11、 ( 熵值法)就是利用熵值来确定各指标的权重。12、在信息论中,熵是对不确定性的一种度量。信息量越大,不确定性就越小,熵也就越(小) ;信息量越小,不确定性越大,熵也越(大) 。根据熵的特性,我们可以通过计算熵值来判断一个事件的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大。13、 (相对比较法)是一种主观赋权法。它将所有指标分别按行和列排列,构成一个正方形的表;然后指标两两比较进行评分,并将评分值记入表中相应位置,再将评分值按行求和,得到评分总值;最后进行归一化处理,求得各指标的权
5、重。14、多指标决策常见的方法包括简单易用的(简单线性加权法) 、适用性强的(理想解法) 。15、理想解法又称为(TOPSIS) (Technique for Order Preference by Similarity to Ideal Solution)法。这种方法通过构造多属性问题的(理想解)和(负理想解) ,并以靠近(理想解)和远离(理想解)两个基准作为评价各可行方案的依据。 (理想解法)又成为双基点法。(理想解):设想各指标属性都达到最满意的解。(负理想解):设想指标属性都达到最不满意的解。16、 (理想解):设想各指标属性都达到最满意的解。(负理想解):设想指标属性都达到最不满意的
6、解。1决策所涉及的问题一般与_。A将来有关 B过去有关 C现在有关 D过去、现在、将来都有关 2合理决策必须具备的三个条件,不包括以下_。A目标合理 B可靠的信息 C有限合理、经济性 D决策结果满足预定目标的要求3战略决策主要是谋求_。A组织目标的实现 B从两个以上的可行方案中选择一个最佳方案C组织内部条件、外部环境和目标三方面的动态均衡 D组织工作的正确指导 4决策方案的后果有多种,每种都有客观概率,这属于_。A不确定型决策 B非程序化决策 C战术决策 D风险型决策 5决策的定量方法是_。A依靠人们的知识、经验和判断能力来进行决策的方法B运用数学方法,建立数学模型来进行决策的方法C确定型、不
7、确定型和风险型决策的方法D一系列科学的处理过程6管理决策主要应由_作出。A高层管理者 B基层管理者 C中、高层管理者 D中层管理者 7主要是根据决策人员的直觉、经验和判断能力来进行的决策是_。A确定型决策 B不确定型决策 C结构化决策 D非结构化决策 1决策所涉及的问题一般与_。A将来有关 B过去有关 C现在有关 D过去、现在、将来都有关 2合理决策必须具备的三个条件,不包括以下_。A目标合理 B可靠的信息 C有限合理、经济性 D决策结果满足预定目标的要求3战略决策主要是谋求_。A组织目标的实现 B从两个以上的可行方案中选择一个最佳方案C组织内部条件、外部环境和目标三方面的动态均衡 D组织工作
8、的正确指导 4决策方案的后果有多种,每种都有客观概率,这属于_。A不确定型决策 B非程序化决策 C战术决策 D风险型决策 5决策的定量方法是_。A依靠人们的知识、经验和判断能力来进行决策的方法B运用数学方法,建立数学模型来进行决策的方法C确定型、不确定型和风险型决策的方法D一系列科学的处理过程6管理决策主要应由_作出。A高层管理者 B基层管理者 C中、高层管理者 D中层管理者 7主要是根据决策人员的直觉、经验和判断能力来进行的决策是_。A确定型决策 B不确定型决策 C结构化决策 D非结构化决策选择题:1、 人工智能的缩写是:(1)EDP (2)AI (3)MIS (4)ES 多选题:1、典型的
9、医学决策支持系统有1、 Mycin 系统2、 Internist-1 和 QMR 系统3、 HELP2、经典的决策树算法(1)ID3 算法, (2)C4.5 算法、 (3)CART 算法、 (4) SPRINT 算法。通常,一个多指标决策问题由以下 3 个要素构成:1决策问题的指标等于或大于 2 个。2指标衡量标准不同,即众多指标之间没有一个统一的标准,难以进行相互比较。3指标导向的不一致性。简答题:1、医学信息决策:是指在进行医学决策时不仅仅凭经验和直觉,而是经过相关信息分析后所做出的决策。基于医学信息的决策常常比较复杂,也会面临很多不确定的情况,以及较为复杂的信息分析方法和多种决策方案的选
10、择。2、人工神经网络(artificialneuralnetwork,ANN),亦称神经网络(neuralnetwork,NN),是一种旨在模仿人脑结构及其功能的信息处理系统,由大量处理单元(神经元,neurons)广泛互连而成的网络,反映人脑的基本特性,是对人脑的抽象、简化和模拟。它可用电子或光电元件实现,也可用软件在常规计算机上仿真,或者说是一种具有大量连接的并行分布处理器,它具有通过学习获取知识并解决问题的能力,且知识是分布存储在连接权(对应于生物神经元的突触 )中,而不是像常规计算机那样按地址存在特定的存储单元中。它是基于神经科学、数学、统计学、物理学、计算机科学及工程等学科的一种技术
11、。3、决策树(decisiontree):是一种能够有效地表达复杂决策问题的数学模型。是一种类似于流程图的树状结构,它表述了在不同条件下会得到特定的辅助决策值的一种规则,或者每个决策可能引出多个事件而导致不同的结果。4、灵敏度分析:检验和评估决策树求解的过程及其呈现在数据上的变化行为称为灵敏度分析。5、1医学信息决策有哪些特性?2决策有哪些分类?3简要说明决策的基本步骤。4信息分析与决策的关系是什么?5什么是定性决策?什么是定量决策?两者是什么关系?1什么是决策树?决策树是如何表示的?决策树有什么用途?2简述 ID3 算法的基本思想。3本章中心血管病患者住院时间分析的案例中,提取的分类规则是什
12、么?4请改变心血管病患者住院时间分析挖掘模型的参数设置,来查看各个参数对决策树的影响?如果希望生成的树为二叉树,应该做何种改变?1线性优化问题的数学模型包含哪几个部分?2什么是松弛变量?3离散优化模型与线性优化模型比较有哪些特点?4求解离散优化问题可否先解相应的线性优化问题,然后用凑整的办法来求得最优整数解,并请说明原因?1什么是多目标决策?它的应用有何特殊性?2简述多目标决策的特点。3在多目标决策中怎样对决策指标进行标准化处理?4哪些方法可以确定决策指标的权重?1简述层次分析法的基本原理及基本步骤。1什么是仿真模拟?叙述仿真模拟的一般步骤。2如何生成服从离散概率分布的抽样序列?3如何生成服从
13、连续概率分布的抽样序列?4在本章第一节叙述的生成服从连续概率分布的抽样序列的一般方法中,用随机数产生器生成的均匀分布随机序列是作何用?5在 Excel 中有几种方法可以生成服从连续概率分布的抽样序列?请举例说明。6请简要举例说明仿真模拟的典型用途。7在应用仿真模拟的方法时,应当注意什么问题?1分别简述等价关系、等价类以及论域划分的定义。2分别简述集合 X 的上近似集与下近似集的定义。3分别简述集合 X 的正域、负域与边界域的定义。4简述粗糙集的定义。5分别简述集合确定度的定义和性质。6分别简述属性依赖度的定义和性质。7分别简述在代数观和信息观描述下的属性必要性、属性约简和核的定义。8分别简述信
14、息熵和条件信息熵的定义。9分别简述在代数观和信息观描述下的属性重要性的定义。10分别简述基于属性依赖度和条件信息熵的属性约简算法。11分别简述决策规则的定义、决策规则可信度的定义和性质。1分别简述等价关系、等价类以及论域划分的定义。2分别简述集合 X 的上近似集与下近似集的定义。3分别简述集合 X 的正域、负域与边界域的定义。4简述粗糙集的定义。5分别简述集合确定度的定义和性质。6分别简述属性依赖度的定义和性质。7分别简述在代数观和信息观描述下的属性必要性、属性约简和核的定义。8分别简述信息熵和条件信息熵的定义。9分别简述在代数观和信息观描述下的属性重要性的定义。10分别简述基于属性依赖度和条
15、件信息熵的属性约简算法。11分别简述决策规则的定义、决策规则可信度的定义和性质。1何谓人工神经网络?它有哪些特征?2生物神经元由哪几部分构成?每一部分的作用是什么?3什么是人工神经元?它有哪些连接方式?4B-P 算法的网络结构是什么?简述 B-P 算法的学习过程。5试利用 MS SQL 2005 智能工具之 ANN 算法模拟一临床诊断分析。1简述新型决策支持系统和传统决策支持系统之间的区别。2简述医疗专家系统的定义以及其局限性。3什么是临床决策支持系统?临床决策支持系统由哪几部分组成?简述临床决策支持系统用户的需求?4简述医院管理决策支持系统涉及哪些决策分析。5简述 HELP 中用药合理性检查
16、报警系统的工作过程。6简述传统的数据库系统无法直接满足决策分析需求的原因。7简述数据仓库的定义、基本特征和结构。8简述数据仓库系统的结构。9简述 OLAP 的定义和存储形式。10简述多维数据分析哪些操作。11简述数据挖掘的定义、以及数据挖掘与数据仓库关系。4、应用题:最可能患胰腺癌者包括 40 岁以上,中腹部疼痛持续 13 周的人。假设这类人中胰腺癌的发生率为 12。如有一种不冒什么风险的早期诊断方法对胰腺癌的检出率为 80(敏感度),但对有类似症状的非胰腺癌患者的假阳性率为 5,用此法诊断确诊的胰腺癌患者手术死亡率为 10,治愈率为 45。根据上述疾病概率,诊断概率和死亡、治愈概率,如对10
17、00 人进行诊断、治疗,其所获得的益处,是否比不进行诊断检查和手术更大?可以用一个决策树(下图)进行分析比较。答案:从以上决策树可见,不作该项检查的死亡者为 12 例,均为胰腺癌病人。用该项检查手术后死亡 12.5 人,其中有 5 例为非胰腺癌病人。而且新的检查使 44 例非胰腺癌患者的胰腺功能因手术而可能受到损害。因此这项检查对病人是弊大于利,不宜使用。2、某一地区患有癌症的人占 0.005, 患者对一种试验反应是阳性的概率为 0.95,正常人对这种试验反应是阳性的概率为 0.04, 现抽查了一个人, 试验反应是阳性, 问此人是癌症患者的概率有多大?现在来分析一下结果的意义.1) 这种试验对
18、于诊断一个人是否患有癌症有无意义?2) 检出阳性是否一定患有癌症?5 章4指标之间的矛盾性。某一指标的完善往往会损害其他指标的实现,即改进某一指标值可能会使其他指标值变坏。5定性指标和定量指标混合。二、不同量纲指标的标准化简单线性加权法是一种常用的多属性决策方法,先确定各决策指标的权重,再对决策矩阵进行标准化处理,求出各方案的线性加权指标平均值,并以此作为各可行方案排序的依据。应该注意,简单线性加权法对决策矩阵的标准化处理,应当使所有的指标正向化。求满意解的 3 种方式:(1)取距理想解最近的方案为满意方案;(2)取距负理想解最远的方案为满意方案;(3)取距理想解最近且距负理想解最远的方案为满
19、意方案。层次分析法(The analytic hierarchy process)简称 AHP,在 20 世纪 70 年代中期由美国运筹学家托马斯塞蒂(T.L.Saaty)正式提出。它是一种定性和定量相结合的、系统化、层次化的分析方法。层次分析法(analytichierarchyprocess,AHP) 是定性分析和定量分析相结合的、多准则的一种决策方法,其特点是在对复杂决策问题的本质、影响因素及其内在关系等进行深入分析的基础上,利用较少的定量信息使决策过程数学化,从而为多目标、多准则或无结构特性的复杂决策问题提供定量依据。熵值法是一种客观赋权法,依据各指标值所包含的信息量的大小来确定指标权
20、重。一个好的递阶层次结构对解决问题极为重要,因此在建立递阶层次结构时,应注意到:(1)从上到下顺序地存在支配关系,用直线段(作用线)表示上一层次因素与下一层次因素之间的关系,同一层次及不相邻元素之间不存在支配关系。(2)整个结构不受层次限制。(3)最高层只有一个因素,每个因素所支配元素一般不超过 9 个,元素过多可进一步分层。(4)对某些具有子层次结构可引入虚元素,使之成为典型递阶层次结构。例 1 选拔干部模型 对三个干部候选人 y1、y2 、y3,按选拔干部的五个标准:品德、才能、资历、年龄和群众关系,构成如下层次分析模型: 假设有三个干部候选人 y1、y2 、y3,按选拔干部的五个标准:品
21、德,才能,资历,年龄和群众关系,构成如下层次分析模型。画出层次分析图例 2, 选拔干部考虑 5 个条件:品德 x1,才能 x2,资历 x3,年龄 x4,群众关系 x5。某决策人用成对比较法,得到成对比较阵如下: a14 = 5 表示品德与年龄重要性之比为 5,即决策人认为品德比年龄重要。两个计算机模拟实例-报童问题仿真和人口模型粗糙集在应用中的优点1. 粗糙集分析数据不需要先验知识.2. 粗糙集理论是适合大数据集分析的强大工具.3. 粗糙集提供了含糊概念的数学描述, 并可计算.粗糙集(roughset,RS) 理论是一种能有效地处理不精确、不一致和不完备的数学工具,它可以从大量数据中分析、推理
22、、挖掘隐含知识及规律,为智能信息处理和计算机应用提供了有效的方法。粗糙集理论的主要优点是不需要数据的任何先验和附加知识,这有别于传统的统计、概率、随机、证据理论及模糊方法等。决策表是一类特殊而重要的知识表达系统,它指当满足某些条件时,决策(行为)应当怎样进行。多数决策问题都可以用决策表形式来表示,这一工具在决策应用中起着重要的作用。给定类 C 的粗糙集定义用两个集合近似:C 的下近似和 C 的上近似。C 的下近似由一些这样的数据样本组成,根据关于属性的知识,它们毫无疑问属于 C。C 的上近似由所有这样的样本组成,根据关于属性的知识,它们不可能被认为不属于 C。类 C 的下近似和上近似如图所示。
23、其中,每个矩形区域代表一个等价类。判定规则可以对每个类产生。通常,使用判定表表示这些规则。客户编号 赞扬竞争对手的产品否挑选产品时间很长距最后一次销售时间客户流失否970102 否 是 长 是970230 是 否 长 是980304 是 是 很长 是980625 否 是 正常 否990211 是 否 长 否990327 否 是 很长 是表中的 970230、980304、990211 客户的“赞扬竞争对手的产品”属性是相似的;980304、990327 客户的“挑选产品时间很长”和“客户流失”属性是相似的;970230、990211 客户的“赞扬竞争对手的产品” 、 “ 挑选产品时间很长”和“
24、距最后一次销售时间”属性是相似的;这样,围绕“赞扬竞争对手的产品”属性就可以产生两个初等集合:970230、980304、990211和970102、980625、990327;而“赞扬竞争对手的产品”和“挑选产品时间很长”属性可以生成三个初等集合:970102、980625、990327 、970230、990211和980304。因为客户 970230 已经流失,而客户 990211 没有流失,由于属性“赞扬竞争对手的产品” 、“ 挑选产品时间很长”和“距最后一次销售时间”是相似的。因此,客户流失不能以属性“赞扬竞争对手的产品” 、 “ 挑选产品时间很长”和“距最后一次销售时间”作为特征进
25、行描述。而 970230、990211 就是边界实例,即它们不能根据有效知识进行适当的分类。余下的客户970102、980304 和 990327 所显示的特征,可以将他们确定为已经流失的客户。当然,也不能排除 970230 和 990211 已经流失,而 980625 毫无疑问没有流失。所以客户集合中“流失”的下近似集合是970102 、980304 、990327 ,上近似集合是970102、970230、980304、 990211、990327 。同样,980625 没有流失,但是不能排除 970230 和 990211 流失。因此,客户“没有流失”概念的下近似是980625,上近似是
26、970230、980625、990211。鲁棒性就是系统的健壮性。它是在异常和危险情况下系统生存的关键。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性。所谓“鲁棒性” ,是指控制系统在一定(结构,大小)的参数摄动下,维持某些性能的特性。根据对性能的不同定义,可分为稳定鲁棒性和性能鲁棒性。以闭环系统的鲁棒性作为目标设计得到的固定控制器称为鲁棒控制器。5本章慢性进行性肝衰竭的例子中,假设了肝活组织检查能够 100地区分肝炎和肝硬化,这在临床上是不可能的。如果假设患有肝炎的肝活检检出率为 90,误诊为肝硬化的可能性为 10。如果病人患有肝硬化
27、的肝活检检出率为 95,误诊为肝炎的可能性为5。求解最优治疗方案,并利用电子表格做灵敏度分析,求出阈值。提示:本例中大家使用转换后的概率树,相关概率的知识本书后面会进一步讲解。图 2-41 原来的概率树图 242 转换后的概率树6王老汉,58 岁,最近被上海某大学附属医院诊断出患有一种特殊类型的脑瘤,这种类型脑瘤中的 50病例表现为良性,50表现为恶性。王老汉的生命将取决于该瘤的类型(良性或恶性) 以及是否切除该瘤。表 25 说明了根据王老汉的生命能够被维持的时间的估计。表 2-5 王老汉的生命能够被维持的时间脑瘤类型 切除脑瘤 保留脑瘤良性 3 年 5 年恶性 3 年 1 年专家在决定是否切
28、除脑瘤之前,为了更好地评估该脑瘤的状况,进行了探查手术。如果该脑瘤为良性,这种探查手术的检出率为 75。如果是恶性脑瘤,这种探查手术的检出率为 65。探查手术由于麻醉等因素有 5的可能性使病人失去生命。试问:如果没有进行任何探查手术,那么,王老汉必须决定是否切除该肿瘤。如果进行探查手术,那么王老汉将要根据探查手术的结果决定是否切除该脑瘤。(1)对该医学诊断问题画出决策树;为了求解决策树需要计算哪些概率?并求解决策策略,使王老汉的生命能够被维持的时间最大化;(2)王老汉的儿女们希望在第 2 年或第 3 年有他们的孩子。假设王老汉想要看到他的孙辈们的可能性最大,这将如何影响他的决策?5本章慢性进行
29、性肝衰竭的例子中,假设了肝活组织检查能够 100地区分肝炎和肝硬化,这在临床上是不可能的。如果假设患有肝炎的肝活检检出率为 90,误诊为肝硬化的可能性为 10。如果病人患有肝硬化的肝活检检出率为 95,误诊为肝炎的可能性为5。求解最优治疗方案,并利用电子表格做灵敏度分析,求出阈值。提示:本例中大家使用转换后的概率树,相关概率的知识本书后面会进一步讲解。图 2-41 原来的概率树图 242 转换后的概率树6王老汉,58 岁,最近被上海某大学附属医院诊断出患有一种特殊类型的脑瘤,这种类型脑瘤中的 50病例表现为良性,50表现为恶性。王老汉的生命将取决于该瘤的类型(良性或恶性) 以及是否切除该瘤。表 25 说明了根据王老汉的生命能够被维持的时间的估计。表 2-5 王老汉的生命能够被维持的时间脑瘤类型 切除脑瘤 保留脑瘤良性 3 年 5 年恶性 3 年 1 年专家在决定是否切除脑瘤之前,为了更好地评估该脑瘤的状况,进行了探查手术。如果该脑瘤为良性,这种探查手术的检出率为 75。如果是恶性脑瘤,这种探查手术的检出率为 65。探查手术由于麻醉等因素有 5的可能性使病人失去生命。试问:如果没有进行任何探查手术,那么,王老汉必须决定是否切除该肿瘤。如果进行探查手术,那么王老汉将要根据探查手术的结果决定是否切除该脑瘤。
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。