1、本科毕业设计论文届论文题目基于遗传算法的企业竞争情报智能采集研究所在学院专业班级信息管理与信息系统学生姓名学号指导教师职称完成日期年月日基于遗传算法的企业竞争情报智能采集研究摘要现代企业之间的竞争越来越激烈,企业如果无法有效地获取自己对手的信息,那么该企业可能无法获得竞争中的主导地位。因此,企业竞争情报研究逐渐受到越来越多的关注。本课题首先对所选课题的背景、意义及研究内容进行了一定的阐述,提出了该课题在研究过程中所遇到的难题及相应的解决方法,并对简单描绘了本课题所要达到的目标。第二,针对遗传算法在企业竞争情报中的应用,对其原理及其应用方面和意义作了相应的介绍,并简述了遗传算法的具体过程。第三,
2、阐述了竞争情报采集在企业竞争的意义及应用现状,并提出了企业获取竞争情报的途径和竞争情报的特点。第四,本课题根据企业竞争情报系统的模型,对竞争情报智能采集描绘了具体的方法与过程,提出了一种基于遗传算法的信息抽取方法,为企业建立一个高效和智能的竞争情报采集打下了良好的基础。关键字竞争情报;遗传算法;智能采集GENETICALGORITHMBASEDINTELLIGENTACQUISITIONOFCOMPETITIVEINTELLIGENCEABSTRACTTHECOMPETITIONAMONGMODERNENTERPRISESHASBECOMEINCREASINGLYFIERCEIFCOMPANI
3、ESCANNOTEFFECTIVELYGETTHEIROPPONENTSINFORMATION,THEFIRMMAYNOTHAVEACCESSTOTHEDOMINANTPOSITIONOFTHECOMPETITIONTHEREFORE,COMPETITIVEINTELLIGENCERESEARCHGRADUALLYBEINGMOREANDMOREATTENTIONFIRST,THESUBJECTMAKESOMEEXPLANATIONTOTHEBACKGROUND,SIGNIFICANCEANDCONTENTOFTHESELECTEDTOPICS,ANDPUTFORWARDTHEPROBLEMS
4、ANDCORRESPONDINGSOLUTIONSENCOUNTEREDINTHECOURSEOFTHESTUDY,ANDSIMPLYDESCRIBETHETOPICSTOBEACHIEVEDSECOND,ASTHEAPPLICATIONOFTHEGENETICALGORITHMINCOMPETITIVEINTELLIGENCE,WEINTRODUCEITSPRINCIPLE,APPLICATIONANDSIGNIFICANCEOFTHEGENETICALGORITHMACCORDINGLY,ANDOUTLINESTHESPECIFICPROCESSOFGENETICALGORITHMTHIR
5、D,DESCRIBINGTHECOMPETITIVEINTELLIGENCEGATHERINGSSIGNIFICANCEANDAPPLICATIONINTHECOMPETITIONOFTHEENTERPRISE,ANDPROPOSEDTHEWAYOFGAININGCOMPETITIVEINTELLIGENCEANDTHEFEATURESOFCOMPETITIVEINTELLIGENCEFOURTH,ACCORDINGTOCOMPETITIVEINTELLIGENCESYSTEMMODEL,THETOPICDEPICTSTHECOMPETITIVEINTELLIGENCEINTELLIGENCE
6、COLLECTIONSSPECIFICMETHODANDPROCESS,ANDPROVIDEAGENETICALGORITHMBASEDINFORMATIONEXTRACTIONMETHODFORENTERPRISESTOESTABLISHANEFFICIENTANDCOMPETITIVEINTELLIGENCEGATHERINGINTELLIGENCELAIDAGOODFOUNDATIONKEYWORDSCOMPETITIVEINTELLIGENCEGASMARTACQUISITION本科生毕业论文(设计)I目录1前言111课题的研究背景、研究现状及意义1111课题的背景1112课题的研究现
7、状2113课题的意义312选题研究的内容及难题4121选题研究内容及结构4122拟解决的关键问题513研究的方法及目标6131研究方法6132研究难点7133预期目标72遗传算法概述721遗传算法原理及特点722遗传算法在信息采集中的应用意义923竞争情报采集的意义103企业竞争情报的特点、获取途径和方法1031竞争情报的特点11311采集信息量大11312竞争情报源的多样化11313信息采集结果随机性1132竞争情报的获取途径12321关于公开资料12322电子信息源中的竞争情报12323本企业内部的竞争情报源13324人际关系网(第三方)信息源13325会议信息的搜集144基于遗传算法的企
8、业竞争情报的智能采集1441竞争情报智能采集方法15411神经网络15412联机分析处理15413遗传算法1642基于遗传算法的企业竞争情报的智能采集模型构建16421信息采集模型构建17422情报服务模型构建275总结28致谢错误未定义书签。参考文献30本科生毕业论文(设计)11前言11课题的研究背景、研究现状及意义111课题的背景近年来信息技术的迅速发展,尤其是国际信息互联网络的出现和广泛应用,加快了信息的传递速度和共享,市场竞争日趋激烈,这在客观上对企业竞争情报研究与应用提出了更高的要求。20世纪80年代,人们就开始把竞争情报作为一门学科进行研究,并把研究成果应用到各行各业的竞争实践中去
9、。特别是在西方国家中,不管是政府还是企业,都把竞争情报工作提到一个新的高度,在其信息化进程中占有重要的地位1。一些经济发达的西方国家的研究人员在上个世纪中叶就已经提出了竞争情报,并进行了深入的研究,将其应用到了现代企业中。然而竞争情报引入中国还只有二十年左右,国内对竞争情报的研究还不够完善,依然处于初级阶段。随着全球经济一体化的发展,企业之间的竞争已经不再单一,而是扩展到了对市场、产品、资源、人才等多方面的竞争。但是,所有的竞争中都涉及到信息的传递及应用,很显然这就是对信息的竞争。信息是一种客观存在的,没有经过加工、处理和分析的数据,它可以依附于视频、声音、书籍等多种载体。然而经过进一步深层次
10、的处理,这些信息就有了更重要的用途服务于企业的情报。情报的生成依赖于信息,而信息是最原始的数据。因此对企业竞争情报的研究,就是基于这样的背景。随着经济活动日益国际化,竞争情报发挥着越来越重要的作用,人们也越来越多地利用INTERNET开展竞争情报活动,许多WEB页面作为有价值的情报被情报用户收集起来1,在商业环境中确定竞争者项目和策略的重要性受到了广泛的关注,而成功往往是基于对检测条件的反应能力2。对于身处激烈市场环境中的企业来说,很有必要对即信息进行有效的搜集、整理和研究,从中分析企业竞争环境、明确竞争目标、实时监控竞争对手动态、掌握产业总体发展状况、及时发现可能的市场预警、制定竞争策略等,
11、使企业能够在第一时间做出应变,为其提供坚实的战略支持及决策建议3,从而进一步增强企业的竞争力。信息的来源多种多样,它们的结构和形式都是不相同的,并且只有一部分是以结构化地数据形式存在,有些信息只能在特殊的环境下才能显示信息。这样的信息需要更深一步的加工处理,才能为企业所用。原始的信息采集都是通过人工的方式,将不同的信息源收集起来整合成可以使用的竞争情报,但是随着互联网的快速发展,信息成爆炸式增长。应用传统的手工方式收集、处理、采集信息已经满足不了现在对竞争情报的需求。本文正是基于遗传算法构建了企业竞争情报智能采集模型。本科生毕业论文(设计)2112课题的研究现状(1)竞争情报的研究现状竞争情报
12、的概念与手法早在20世纪五六十年代分别由美日的研究人员与企业提出并率先应用。企业竞争情报(ENTERPRISECOMPETITIVEINTELLIGENCE,简称ECI)是指为满足企业竞争决策需求,实现其竞争战略目标所需的有关信息和知识4。过了几十年后,竞争情报才被一些专业的行业机构作为一门学科,从理论、方法、实践、应用等多方面加以研究,并在全球范围内的企业中宣传及推广使用。在国外,由于国家经济发达,信息化水平高,企业竞争激烈,对竞争情报研究深入,应用比较早。竞争情报活动最初是由美国开始发起的,其原因是日本企业的快速发展抢占了美国传统产业的主导地位,例如汽车通用、柯达、施乐等大型跨国企业,有的
13、甚至被对方彻底打垮。后来经多位经济学家研究和实验发现,导致这些现象的关键因素在于日本企业对竞争情报的重视程度。竞争情报活动便由此展开,目前美国有一半以上的企业开展了竞争情报,并在里面扮演了重要的角色。之后,欧盟的一些国家将竞争情报的理念融入其他管理方面,并建立了全球工商情报联盟,帮助许多大型企业建立开展竞争情报活动的相关体系。其他一些发达国家也纷纷效法,各自建立了竞争情报专业协会。竞争情报是增加竞争力的有效工具,也是当代社会的一种新兴服务行业。我国自1956年以来,建立了情报机构及相应的体系,并不断完善,使得竞争情报得到了快速的发展。与一些发达国家的交流与合作,解决了一直以来我国国内情报科学在
14、研究和交流渠道方面的困扰。国内许多大型企业认识到竞争情报的竞争力后,纷纷建立起了各自的竞争情报模型。同时国内也出现了许多提供竞争情报服务的公司,但是由于其本身缺乏专业知识,无法提供专业的竞争情报服务,让竞争情报服务这一块出现了一些空白。相对而言,我国的竞争情报研究比国外晚,研究成果也无法同其他发达国家相比。但是,我们可以借鉴国外比较完善的竞争情报研究,避免犯相同的错误,构建适合自己的竞争情报采集模型。(2)遗传算法的应用现状遗传算法主要是根据自然界的生物体在适者生存、不适者淘汰的自然规律下,个体不断地进行选择、变异及遗传,以适应生态环境的变化这一现象演化而来。该算法最早是由美国的一位教授即遗传
15、算法创始人HOLLAND教授首先提出的,并且他在1975年出书阐述了遗传算法研究方面极为重要的模式理论,而这也意味着遗传算法得到了正式的承认。上个世纪90年代左右,遗传算法开始真正兴起,与此相关的国际会议例如GECOO(GENETICANDEVOLUTIONARYCOMPUTATIONCONFERRENCE)等也多次举行,这不仅引起了学术界对遗传算法应用和理论研究地重视,也将遗传算法的发展态势本科生毕业论文(设计)3及时反映出来。遗传算法是一种启发式的有向随机搜索算法,在进化过程中是否收敛到全局最优解成为其应用于实际问题是否成功的关键5。同时,另一个重要的理论问题便是如何选择遗传算法中的控制参
16、数。由于遗传算法只是简单的模拟了生物的进化机制,所以遗传算法在许多应用方面,仍存在着相应的问题。但是随着遗传算法的不断完善,该算法被应用于其他领域,同时他的应用方面也是近年来的研究热点。下面简答介绍一些应用领域(1)函数优化。这是遗传算法应用的经典领域。在一些多模型、多目标类型的函数优化问题上,使用遗传算法能得到满意的结果。(2)生产调度问题。遗传算法避免了生产调度过程中实际与计划的差距,使复杂多变的问题得到有效地解决。(3)自动控制领域。遗传算法在参数识别等方面具有较好的优势,随着该算法的不断完善而被逐渐应用于该领域。(4)社会与经济领域。许多企业利用遗传算法的特性,将其应用于竞争情报的采集
17、,为其他行业服务。(5)人工智能与科学计算。现实中很多问题无法求得最优解,而遗传算法因为可以用近似解来逼近最优解,故此被应用在很多问题中。(6)人工生命。通过研究人在学习、行为等方面的现象,从而使遗传算法在该些方面得到相应的应用。(7)机器学习。基于GA的机器学习、特别分类系统,在调整人工神经网路的连接权、神经网路结构的优化设计和多机器人路径规划系统中得到了成功的应用6。113课题的意义随着经济活动日益国际化,企业面临的竞争越来越激烈,以信息技术为主要标志的高新技术革命已经引起了社会各个领域的深刻变革7。情报和信息已经成企业竞争中重要的资源,企业只有建立起相对于竞争对手的情报优势,才能使企业保
18、持持续的竞争优势。在激烈的市场竞争中,对先机和主动权的把握是许多企业得以维持和发展壮大的关键因素。“知己知彼”的重要性也就是企业要对自身在竞争环境中所处的地位和状态有较为客观的了解与评价,这一点随着竞争情报系统的发展正在被越来越多的企业所认同2。在网络技术不断发展的今天,信息源急剧增长,企业获取信息的渠道变得多样,存储方式变得更加灵活。然而我们获得原始信息的结构类型并不统一,这样直接对信息进行归类、处理、分析,本科生毕业论文(设计)4有一定的难度。而将遗传算法这种数据挖掘技术应用到企业竞争情报的采集中,则可以自动将信息收集起来,从中挖掘信息的知识和情报,进一步提高情报分析的深度和效率。实际上,
19、已经有一些企业应用了遗传算法这种数据挖掘技术为情报采集服务,并取得了一定的效果。故此,遗传算法这种数据挖掘技术在竞争情报采集中具有很重要的现实意义。在市场竞争环境中,企业获得的资本、技术、劳动力、政府政策、全球竞争态势等信息从一定程度上影响了企业的总体竞争力。开展竞争情报活动可以将所有的信息整合成企业所需要的竞争情报,为企业赢得市场竞争的先机。因此,激励与完善竞争情报的理论与方法有极其重要的意义,这些主要体现在以下几个方面(1)开展竞争情报活动有助于提升企业整体竞争力竞争情报可以帮助企业了解企业竞争对手的发展状况以及该行业的优势、风险等多方面的信息资料。这有助于企业充分了解行业内的现状,于环境
20、恶化前做出企业结构层次的调整、加快企业的技术创新,从而提升企业的整体竞争力。(2)开展产业竞争情报活动能为企业内部的相关企业提供决策支持企业是市场竞争的一个个体。一个行业内企业生产的产品和提供的服务基本相同或者类似,例如生产设备、产品性能、产品式样、销售渠道、原料配置等方面,因而这些企业在开展竞争情报的活动时具有相同的特征。这时利用竞争情报可以帮助企业在决策时获得更多的信息源,做出最优的决策,使其在行业内获得优势。(3)开展企业竞争情报活动有助于促进资源要素的合理配置企业在一个行业内,所能获取的资源都是一定的,但由于地域、人力等多方面的因素,每个企业在获取自己所需的资源时候未必都能容易的得到,
21、尤其是一些稀缺但又是关键的资源。这时候,企业就需要充分考虑到技术、资金、人力、环境、产地等方面的因素,从地理空间的角度实现资源的优化配置,充分合理的使用资源,使企业在行业的竞争中获得绝对的竞争力。12选题研究的内容及难题121选题研究内容及结构竞争情报过程是竞争情报工作者根据情报用户的需求,采集、加工、分析、生产与传播竞争情报的过程。在现代竞争情报采集过程中,需要对竞争情报进行评价,情报源的合理选择,会影响情报采集的质量8。在面对大量的数据信息源中,如何进行有效地情报采集工作也是一个研究热点和难点。所以本课题研究的主要内容就针对这些问题而展开在企业竞争情报以及智能采集等相关知本科生毕业论文(设
22、计)5识熟悉的基础上,提出了一种数据挖掘技术,即遗传算法。数据挖掘是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律的过程9。同时从应用的需求性与技术的可行性等角度出发,根据网络环境下企业竞争情报系统的特点,对企业的竞争情报特点和企业竞争情报研究现状进行了相应的分析,同时结合这些信息构建数据挖掘中遗传算法的适应度函数,确定进行种群优化的信息匹配算子、信息优化算子、信息选择算子,最后通过的不断地迭代从而实现最优种群即竞争情报。本课题对企业竞争情报智能采集模型做出了一点改进,让企业竞争情报的智能采集基于以上而内容实现。122拟解决的关键问题(1)遗传算法的编码及适应度函数的确定遗传算法(GEN
23、ETICALGORITHM,GA)是基于进化论中自然选择机制的、并行的、统计的随机化搜索方法10。遣传算法是模拟生物进化过程的算法,由3个算子组成,即繁殖(选择)、交叉(重组)、变异(突变)11。遗传算法具有良好的并行性、很强的随机性,能很快地实现全局最优结果,这使该算法在面对大规模信息数据处理时表现出一定的优势。遗传算法不能直接处理问题空间的参数,必须把它们转换成遗传空间中染色体上的基因。遗传算法在实际应用中需要根据不同情况将具体情况转化成遗传学上的染色体。这个过程只是该算法应用的开端,但是编码设计的好坏关系到竞争情报采集的优劣。本课题的适应度函数主要是根据相关关键词在主题、文档所出现的频度
24、,以及该文档发布时间的先后来确定该信息是否具有价值,并在此基础上进行遗传选优化形成新一代种群。同时,通过不断的选择、交叉、变异等操作产生最优的种群,从而形成智能采集的情报。简单遗传算法在任何情况下都是不收敛的,即不能搜索到全局最优解;另外早熟问题也是遗传算法中不可忽视的现象。但可以通过动态确定变异概率改进交叉算子等方法来改进遗传算法,避免局部最优现象。由于遗传算法中,适应度函数要比较排序并在此基础上计算选择概率,所以适应度函数的值要取正值。由此可见,在不少场合,将目标函数映射成求最大值形式且函数值非负的适应度函数是必要的。在具体应用中,适应度函数的设计要结合求解问题本身的要求而定。从理论上讲,
25、为了模拟系统,这需要清晰地了解精确的数学投入产出关系12。适应度函数设计直接影响到遗传算法的性能。在现实条件中,适应度函数、匹配算子、初始种群等等,难以找到合适的点。有时还需要根据曾经的经验来设定,对于没有经验的人来说是比较困难的。遇到具体的情况,还需要改进遗传算法以适应当前的问题。遗传算法在进化过程中一般不需要其他外部信息,仅用评估函数来评估个体或解的优劣,并作为以后遗传操作的依据。本科生毕业论文(设计)6(2)企业竞争情报的智能采集。在本课题的企业竞争情报智能采集过程中,主要涉及到信息收集、情报采集以及情报服务这三个部分。其中信息收集和情报采集是整个竞争情报智能采集过程中最为重要的部分,而
26、情报采集又其中的核心部分,它的主要目的是如何在浩瀚的信息中智能地采集企业所需要的情报,从而服务于客户。智能采集是本课题的主要目标所在,应用遗传算法,就是为了更好地采集竞争情报13。它有别于通常的情报收集,重在竞争情报的智能分析和知识提炼过程14。竞争情报系统需要向用户提供面向主题的数据挖掘及深层的数据分析,要实现这些功能,就要将竞争情报系统建立在数据挖掘技术基础上。数据挖掘是一种新的商业信息处理技术15,将遗传算法这种数据挖掘技术应用到企业竞争情报采集中的问题在于如何将情报采集的具体问题转化为可解决的数学模型。另外,对数量庞大的结构化、半结构化甚至非结构化的数字信息进行分类、处理和分析,从中得
27、到企业需要的情报,是当前竞争情报采集所需要解决的难题。传统的竞争情报系统是建立在企业信息管理系统之上的,如MRP/MRP,内部数据主要源自企业数据库,数据格式比较规整,容易处理4。但是,这种处理方式比较简单,使得得到的结果就会不够深入。遗传算法是作为一种数据挖掘技术,能够将数据中挖掘潜在的知识和情报,因此要在原有竞争情报系统基础上使用遗传算法这种数据挖掘技术加强对数据的处理,从而满足数据挖掘的要求,实现竞争情报的智能采集,这也是当代社会企业获取有价值的信息所必须采取的措施之一。13研究的方法及目标131研究方法(1)文献研究法。在整个毕业设计的过程中,对文献的利用主要是基于文献研究法。首先,在
28、导师的指导下。通过对竞争情报及其现状的探讨,确定了本论文的课题。其次,对整个设计过程和进度作出计划。然后,通过在图书馆,网络资源中搜索相关的文献资源,并进行鉴别、整理和研读,形成对该研究课题的客观认识,并在此基础上产生自己的想法和认识。(2)定量分析方法。在本课题的的设计过程中,阅读了大量的文献资料和论文,对相应的遗传算法及其应用有了一定的了解和认知。对某些具体难解的问题,在导师的指导下,有了更深层的了解与掌握。通过自己的思考与联系,对研究对象进行一系列量的处理,从而作出正确的说明和判断,建立数学模型,并用数学模型计算出分析对象的各项指标及其有关数值。本科生毕业论文(设计)7132研究难点本论
29、文研究的难点在于,在遗传算法的实际应用中,如何通过竞争情报中的信息设计编码方法,确定信息匹配算子,适应度函数,以及信息优化的变异算子等,同时避免遗传算法带来的局部最优现象。遗传算法的优势在于优化信息,从而实现竞争情报的智能采集,这也是针对当今社会如何从浩瀚的信息中提取有价值的信息并尽快做出反应这种现象的一种解决方法。133预期目标本课题预计达到的目标在于,通过遗传算法的学习,并结合现代企业竞争情报采集的的要求,确定相应的适应度函数及其相关算子,同时给出相应的模型,实现企业的竞争情报采集智能化,使得获取的竞争情报更加符合现代企业所需,提高企业的竞争力,为企业赢得行业竞争中的先机。2遗传算法概述遗
30、传算法(GENETICALGORITHM)是近年来发展比较快速的一种新兴技术,它模拟了自然界进化过程中的自然选择机制,它的基本思想是基于达尔文提出的进化论,即生物在自然条件的作用下,通过繁殖、变异、交叉这些方式进行优胜劣汰的过程。该算法最先是由一位美国教授JHOLLAND提出的,随后他便发表了相关的著作,使得遗传算法得到了快速地发展,并被广泛被人们所知。一般意义上所认为的遗传算法GA是指简单遗传算法(SGA)21遗传算法原理及特点遗传算法(GENETICALGORITHM)在实际应用中,并不像其他算法一样需要通过一些函数的辅助才能完成对个体的优化操作,这也是它最显著的特点。另外由于遗传算法在全
31、局搜索方面表现出的优异性,使得该算法有一定的智能特性,能自动搜索相应的优化解集,不需要确定的规则。遗传算法由于其解决问题以混饨、随机和非线性为典型特征,为其他科学技术无法解决或难以解决的复杂问题提供了新的计算模型。对于大量数据的无序特征,遗传算法是有效解决此类问题的方法之一14。遗传算法的基本运算过程如下1染色体编码。编码主要是指将问题中的参数转换成生物中的染色体或个体的操作过程。编码方法有很多种,例如二进制编码方法、实数编码方法等。目前一般都采用二进制编码方法。本科生毕业论文(设计)82适应度函数。该函数是用来计算个体的适应度的。若个体适应度高的,则被保留下来的概率很大,否则就要被淘汰。遗传
32、算法的适应度是通过与种群中其他个体相比较,得到接近最优方案的个体4。3选择算子。选择是对种群中的个体进行优胜劣汰的过程,它的选择依据是每个个体的适应度大小。4交叉算子。交叉是基因在不同染色体的相同位置上进行交换的过程,它可以增加新的种群个体,是遗传算法中最重要的部分。5变异算子。变异是染色体上的某一基因位进行异位的过程,它增强了遗传算法找到接近最优解的能力,一般变异的概率很小。6终止条件。种群迭代的终止条件有很多种,一般采用的是检查适应度的变化,如果个体适应度没有变化,那就终止算法。种群中的不同个体对整体进化的作用是不同的,优良的个体之间的基因重组是群体进化的决定性力量,较差个体在种群中是一个
33、不断被淘汰的过程15。遗传算法在数据挖掘技术中占有很重要的地位,这是由它本身的特点和优点所决定的。(1)遗传算法与传统方法有一定的区别,遗传算法处理的对象不是参数本身,而是参数的编码集。它从初始种群开始搜索,在问题的决定因素和控制参数上操作,避免出现局部最优现象。(2)遗传算法具有并行性。遗传算法适合大规模并行,能在目前所有的并行机或分布式系统上进行处理,而且对并行效率没有太大影响。另外遗传算法具有隐含并行性,由于遗传算法采用种群的方式组织搜索,因而可以同时搜索解空间内的多个区域,并相互交流,使得该算法具有极好的全局搜索性能,减少了陷入局部最优解的可能16。(3)遗传算法不是采用确定性规则,而
34、是采用概率的变迁规则来指导它的搜寻方向2。利用概率转移规则是指利用随机工具指导搜索,进入搜索空间中最好的区域,而不是随机搜索。(4)遗传算法具有可扩展性。遗传算法能和其他技术结合,并利用各自的优势解决许多领域中无法解决的难题。同时,它的应用范围也扩展到了管理科学、社会科学等许多行业的不同领域。(5)遗传算法使用适应度函数进行搜索。传统的搜索方法在求解问题上是需要目标函数可导的,而遗传算法却并不需要这些辅助信息,只要有适应度函数和编码串就可以解决相应的问题,并自动寻求最优策略。本科生毕业论文(设计)9(6)使用遗传算法经常会遇到早熟问题,这是因为超级个体出现在种群中,并且交叉、变异操作无法有效地
35、解决该问题,这时候我们需要对算法进行改进,减少遗传算法被干扰。(7)遗传算法是否具有实际效果取决于待解决问题的表示,例如适应度函数、编码方法的选择、种群规模等方面。参数的选择有很大的灵活性,并无规律可循,问题的改变就意味着需要重新改变参数。22遗传算法在信息采集中的应用意义过去的竞争情报主要依赖于对显性知识的分析,而传统方法与数据挖掘的结合,能够使隐性知识浮现出来,确保情报收集更加全面、数据分析更有说服力。数据挖掘的出现大大加强了信息分析的能力,其中分类、聚类、综合以及关联分析等技术使信息分析更加完备和丰富,为企业决策提供了强有力的工具9。遗传算法是数据挖掘技术的其中一种。该算法在局部收敛方面
36、存在着一定的局限性,虽然有时可以运用它的全局收敛到达最优解附近,但这样耗时时间长。这主要是在种群不断优化的过程中,种群个体之间的差异不再明显,使得遗传算法到达局部收敛。为了避免在遗传算法的应用中出现这样的情况,我们需要科学合理的设计适应度函数以及相应的选择、交叉、变异算子。另外,将遗传算法和其他技术相结合形成混合遗传算法也是很好的方法,这种混合遗传算法在解决优化调度、自动控制、组合优化等方面显示出优越的性能,成为人们解决复杂问题的新方法、新思路1。随着对遗传算法研究的不断深入,它已经成为数据挖掘领域的一个重要研究课题,并出现了很多决策树、模糊规则、分类器等方面的资料,同时在数据挖掘方面的应用也
37、被重视起来。遗传算法是一种全面并行优化的搜索工具,它在解决问题的混沌、随机及非线性方面表现出其固有的特点。由于遗传算法可以为传统方法难以解决的问题提供新的计算模型,因而该算法被更多的领域所接受。遗传算法的应用并不依赖于任何辅助信息或梯度信息,这样降低了整体收索策略和优化搜索的难度。遗传算法应用的关键在于适应度函数及相关算子的设置是否合适。因此遗传算法对问题的具体领域没有任何限制,同时也为问题的求解提供了一个很好的框架结构。这些特性让遗传算法在很多领域得到了广泛的应用。本科生毕业论文(设计)1023竞争情报采集的意义在信息网络时代中,虽然互联网、数据库、文献资料为企业提供了很多的信息源,但却无法
38、保证信息能被企业完全转化成自身所需要的竞争情报。特别是目前我国仍然使用人工方式进行竞争情报的采集工作,这不仅增大了工作量,也无法使信息得到最有效的应用。传统竞争情报的收集、整理、分析工作存在着下面的问题。(1)在竞争情报的收集工作中,通过一些搜索引擎等检索工具自动化收集起来的信息数量庞大,并且多数是表面的、零乱的、非连续的、重复的,有时甚至是一些无事实依据的信息,这让竞争情报的进一步分析变得更加困难。(2)在情报整理时,一些结构化的数据整理比较简单,而对于半结构化、异构分布类型的数据无法自动排序、归类,需要用人为的方式将其变成结构化的数据类型才能进行处理。(3)情报的分析过程,需要一定的智能性
39、。它不是将数据简单地进行检测,而是要挖掘里面更深层次的信息。传统的人工分析在面对浩瀚的信息时,便出现了它的局限性速度慢、效率低;稳定性不强,一般依据个人的经验或者通过定性分析来判断。有些信息虽然经过整理分析之后得到了背后的情报,但那只是浅层的信息,更深层次的情报却无法获取。信息数量的不断增长,对竞争情报活动提出了很高的要求,需要竞争情报采集按照情报需求而展开,在搜集阶段尽可能多地采集数据和信息,在分析阶段能及时地对信息进行有效处理,在传递阶段能将情报按要求交付给关键的决策人员。竞争情报的采集已不仅仅只追求数量,而是要从中挖掘出对企业有用的竞争情报,实现质的跨越。而将分析和获取相结合的自动化、智
40、能化的采集方法,在竞争情报采集中充分体现了自己的优势它可以将企业内外的信息资源进行整合,实现信息共享;通过一定的整理、转换等预处理方法将信息变得有序化、规范化,易于使用;竞争情报采集蕴藏于企业的各个部分,能有效帮助企业获取有益的情报知识;能自动从数据仓库及互联网中提取有用的情报;在竞争情报采集工作中,能推导出新的情报知识。这也就意味着传统人工情报活动方式已经不适应当前竞争战略的需要,企业竞争情报活动信息化成为了必然趋势。企业竞争情报是企业通过搜集、分析后得到的关于竞争环境的信息,竞争情报系统建设已经成为各企业的战略举措13。3企业竞争情报的特点、获取途径和方法普赖斯科特(JOHNEPRESCO
41、TT)教授认为企业竞争情报系统是一个持续演化中的正式与非正本科生毕业论文(设计)11式操作流程相结合的企业管理子系统,其主要功能是为企业组织和成员评估关键发展趋势,跟踪正在出现的不连续性变化,把握行业结构的进化,以及分析现有和潜在竞争对手的能力和动向,从而协助企业保持和发展竞争优势。包昌火认为竞争情报系统是以人的智能为主导、信息网络为手段、增强企业竞争力为目标的人机结合的竞争战略决策支持和咨询系统,是企业信息化的重要构成。综合以上观点可以看出企业竞争情报系统是以计算机技术和网络为手段,将企业自身、竞争对手和外部环境信息进行收集、处理、分析,并将分析结果提供给企业各级决策人员的信息系统10。31
42、竞争情报的特点311采集信息量大企业竞争情报利用不同的科学技术对INTERNET上的信息进行自动收集和简单分析,并没有对相关的结构化数据进行深度的检测、筛选和去重,然而信息源是多种多样的,这样使得企业的竞争情报获得的最后结果有很多异结构化、半结构化、非结构化的信息。这样的信息收集结果可能会增加信息分析的困难,同样也可以减少信息的流失,缩短信息源的检索范围,从某种程度上来说,也是降低了信息分析的工作量。312竞争情报源的多样化传统意义上的竞争情报来源表现在报刊、书籍、企业内部档案等纸质形式的资料。但是随着互联网的发展和普及,现代意义上的竞争情报来源变得多样化,例如电子图书馆、影像、音频、网络数据
43、库等不同存储形式的资料都是竞争情报的来源。同时,竞争情报源还可以来自经过不同层次处理的文献资料。网络是信息传播、处理、发布的中转站,这个平台中蕴含着大量的产品、竞争对手、客户、市场供求、政策以及微观经济等等多格式的信息资源。对于任何一个企业来说,网络是企业获取情报的重要途径。313信息采集结果随机性世界上许多公司在挖掘信息的时候一般都会使用相应的辅助工具,但是信息的收集、整理和分析具有一定的系统性,如果公司没有相应的条件来培养这样的人才,就会将这些工作交由专业的公司负责。由于人为的处理方式带有一定的主观性,得到的情报也未能跟上信息的变化速度,同时它也不够稳定,导致采集结果随机性较大,缺乏定量化
44、的科学依据。传统意义上收集的竞争情报只是本科生毕业论文(设计)12通过WEB搜索引擎,而没有考虑企业的信息需求,搜索出的信息量庞大,经常将与用户兴趣不相关的信息提交给用户9,使得企业收集到的情报比较凌乱无序。对于这样的文档常常需要系统地整合、处理,并进行人为地分类、整合,才能挖掘到信息的潜在价值。另外,由于缺乏对信息源进行统一的管理,竞争情报收集效率、效果并不理想。32竞争情报的获取途径采集竞争情报的途径有很多,不同的信息渠道可以获取的竞争情报也不尽相同,其包含的竞争情报价值差异也很大。一般来说,竞争情报的获取途径主要包含关于公开资料、电子信息源中的竞争情报、本企业内部的竞争情报源、人际关系网
45、(第三方)信息源、会议信息的搜集。下面主要对这些信息渠道进行相应的介绍321关于公开资料公开资料中包含了很多有用的信息,但却不是显而易见的信息资料,这些信息往往需要我们对其进行不同程度的筛选、整理、分析、整合等。一般来说,绝大部分的情报是来自公开资料的,而只有很少一部分时来自机密资料或文件的。虽然理论上如此,但是我国公开的信息源中,能获取的情报很少。针对公开资料进行竞争情报的分析工作需要有一定的敏感度以及相应的竞争情报分析能力。目前的公开资料主要由企业名录、产品样本、报纸和剪报、专利文献、上市公司年报、非上市公司财务信息、行业性期刊等。在这些公开资料中个,企业名录中的信息最为集中,它不仅可以帮
46、助企业了解竞争对手的企业规模、产品、产量、销量、销售额等信息,还可以用这些信息分析出新的信息;另外上市公司的年度报告是最重要的公开资料,它包含了一家企业的盈利、负债、总资产、会计政策、投资、库存、持股数、名列前几名的股东情况、股本变化及股本结构、资金运用等重要的企业财务信息,有时候甚至是客户情况、内部管理、人事等信息,这些不仅有数量指标,还有质量指标可供分析时参考。322电子信息源中的竞争情报电子信息源似的竞争情报有很多,例如数据库、企业网站、网上讨论获得的信息都可以是竞争情报。数据库将许多有用的数据存储在一起,并提供相应的检索入口为需要信息的情报人员提供检索服务。情报人员可以通过多种方式进入
47、数据库中获得相关的信息,这些信息可以是反映竞争对手特本科生毕业论文(设计)13征的词,也可以是几个字段拼凑起来满足一定要求的词。在特定的时间段里,情报人员检索到的信息数量,可以反映该情报人员的检索效率。企业网站一般都是由该公司内部人员将相应的信息发布在网上。网络的四通八达,将消息传递得很快。因此竞争情报的监测可以从对方的网页着手。从网页上,我们可以了解对方产品的信息,例如是否促销,是否有新产品等;我们还可以了解对方公司的人力资源状况,例如是否招聘等。当然并不是网页上所有的内容都具有信息价值,我们也不可能一打开网页就找到有用的信息,而有些有价值的信息,也不是通篇描述的,有些信息需要深层次地加工才
48、行。网上讨论获得的信息是指利用电子邮件、新闻服务和一些聊天工具进行讨论,从交流中获取有用的情报。互联网上的电子论坛一般是专题论坛,其中有很大一部分是公司拥有的。它讨论的主题都是围绕其产品和服务,在这个过程中,我们可以了解到企业产品的一系列资料,例如产品供应商、销售商,用户使用该产品之后的反馈,产品的售后服务等。323本企业内部的竞争情报源竞争情报很大一部分是来自企业内部的。其实每个企业一直都在积累信息,只是微量的信息很难被人发觉,只有信息积累到一定的量才会被人所察觉,价值也才慢慢体现出来。信息如果不能被人发现它的价值,那么它的生命就结束了。同样地,信息只有不断地被传播,其价值才能极大化。很多企
49、业由于无法在企业内部获得有用的信息,转而向外界寻求信息。解决这个问题的方法是鼓励员工积极挖掘信息背后的价值,并将其传递给其他的人知晓。事实上,很多企业职工都具有信息的整理和分析能力,他们通过一定的渠道掌握了某些信息之后,利用他们的专业知识、时间经验、业务和社会关系等就可以得到他们想要的信息。然而在组织结构中,如果两个个体(横向和纵向都一样)相离得太远就很难成功得传递信息,例如收发员和经理交流的可能性很小,信息就很难传递,同理销售产品的市场经理和人事经理也一样。要想使内部的信息系统能够长久运转下去,企业需要提供一定的激励机制(信息反馈、感谢信、表扬、奖励、规定等)鼓励那些善于挖掘信息背后价值的员工,并仔细考虑他们所提出的内容。324人际关系网(第三方)信息源询问是最直接的方法。对象包括客户、供应商、对手的现雇员和前雇员,甚至是竞争对手。在人与人的交往中,总要涉及到与人打交道的时候。我们可以将与两个主体都有一定关系的机构或人称为第三方,其中包括商会、零售商、加工厂、销售商、电视媒体、安监部门、网站、事务本科生毕业论文(设计)14所、证劵公司、注册会计师、娱乐公司等等。对一些中小企业来说,很多情报是通过交谈、询问、采访等人际交往的方式所获得的。有些企业因为自身条件的限制,无法建立自己的竞争情报系统,也无法从社会上获得专业性的竞争情报服务,这时他们可以实行相互合作,利用相关的