Networked information management【外文翻译】.doc

上传人:文初 文档编号:13933 上传时间:2018-04-14 格式:DOC 页数:7 大小:45.50KB
下载 相关 举报
Networked information management【外文翻译】.doc_第1页
第1页 / 共7页
Networked information management【外文翻译】.doc_第2页
第2页 / 共7页
Networked information management【外文翻译】.doc_第3页
第3页 / 共7页
Networked information management【外文翻译】.doc_第4页
第4页 / 共7页
Networked information management【外文翻译】.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

1、1本科毕业论文外文翻译外文文献原文NETWORKEDINFORMATIONMANAGEMENTMATERIALSOURCEBTTECHNOLOGYJOURNALAUTHORNJDAVIESANDMCREVETTEVERYDAYMILLIONSOFPEOPLETRAWLTHEINTERNETFORINFORMATIONUSINGANYONEOFADOZENORMOREDIFFERENTSEARCHTOOLSWHETHERTHEYFINDWHATTHEYARELOOKINGFORMAYDEPENDNOTONLYONTHEIRSKILL,BUTALSOONTHEIRLUCKINTHECORPORAT

2、EARENA,ORGANISATIONSAREMAKINGINCREASINGAMOUNTSOFINFORMATIONAVAILABLEVIAINTRANETSTHISPAPERLOOKSATTHELIMITATIONSOFCURRENTNETWORKEDINFORMATIONMANAGEMENTTECHNOLOGY,INPARTICULAR,SHORTCOMINGSINTHEAREASOFRETRIEVING,ORGANISINGANDSHARINGOFINFORMATION,ANDANINFORMATIONMANAGEMENTPROCESSWHICHWOULDOVERCOMETHESEPR

3、OBLEMSISDESCRIBEDTHEREPRESENTATIONOFAUSERSINFORMATIONNEEDSANDINTERESTSINAUSERPROFILEISSEENTOBECENTRALTOTHEPROCESSANDWORKINTHISAREA,INCLUDINGANOVEL,NONEXPLICITAPPROACHTOTHEREPRESENTATIONOFPROFILES,ISCOVEREDFOURINFORMATIONACCESSSYSTEMSDEVELOPEDATBTLABORATORIESAREDISCUSSEDANDTHEEXTENTTOWHICHTHESEARECUR

4、RENTLYABLETOSUPPORTTHEINFORMATIONMANAGEMENTPROCESSISCONSIDERED1INTRODUCTIONEVERYDAYMILLIONSOFPEOPLETRAWLTHEINTERNETFORINFORMATIONUSINGANYONEOFADOZENORMOREDIFFERENTSEARCHTOOLSBUTWHETHERTHEYFINDWHATTHEYARELOOKINGFORSOMETIMESDEPENDSNOTONLYONTHEIRSKILL,BUTALSOONTHEIRLUCKSTUDIESINDICATETHATMANYEXISTINGSE

5、ARCHENGINESDONOTMEETTHENEEDSOFUSERS2CURRENTTECHNOLOGYSOMELIMITATIONSTHEREAREANUMBEROFPROBLEMSENCOUNTEREDWITHCURRENTINFORMATIONMANAGEMENTTECHNOLOGYMOSTPROBLEMSCENTREAROUNDDIFFICULTIESINFINDINGRELEVANTINFORMATIONSIMPLEKEYWORDQUERIESOFTENYIELDTOOMANYRESULTSOFVARIABLEQUALITYITISUSUALTORECEIVESEVERALHUND

6、REDHITSDOCUMENTSMATCHINGTHEUSERSQUERYEVENONRELATIVELYNARROWQUERIESANDTORECEIVETHOUSANDSOFHITSFORAQUERYISNOTUNCOMMONRESEARCHALSOSHOWSTHATUSERSDONOTFINDITEASYTOFRAMETHEQUERYNEEDEDTO2RETURNTHEINFORMATIONTHEYREQUIRE3THEINFORMATIONLOCATIONANDMANAGEMENTPROCESSINFORMATIONSOURCESAREINCREASINGINSIZE,COMPLEXI

7、TYANDNUMBERAND,ASSHOWNINTHEPREVIOUSSECTION,CURRENTINFORMATIONRETRIEVALTECHNIQUESAREINSUFFICIENTFORVERYLARGE,MULTIMODAL,NETWORKEDINFORMATIONSOURCESTHEINTERNETISANEARLYEXAMPLEOFTHEINFORMATIONNETWORKSOFTHEFUTUREANDISINCREASINGLYBEINGCOMMERCIALLYEXPLOITEDBECAUSEOFTHELARGEAMOUNTOFINFORMATIONAVAILABLE,USE

8、RPROFILINGWILLBECRUCIALTOTHEINFORMATIONPRODUCTSANDSERVICESOFTHEFUTUREMASSCUSTOMISATIONTHEPOSSIBILITYOFCUSTOMISINGTHESERVICETOEACHCUSTOMERBASEDONTHATCUSTOMERSPRIORITIESANDINTERESTSCOULDBEAKEYMARKETDIFFERENTIATOR31SEARCHINGASEARCHQUERYMAYCOMPRISEASETOFKEYWORDSPROVIDEDBYAUSERORITMAYBEAUTOMATICALLYGENER

9、ATEDEXAMPLESOFAUTOMATICALLYGENERATEDQUERIESARETHOSEGENERATEDFROMAUSERSPROFILEPERHAPSTOPERIODICALLYSEARCHFORITEMSOFINTERESTTOTHATUSERORFROMADOCUMENTTYPICALLYTOFINDSIMILARDOCUMENTS32REFINEMENTREFINEMENTOFASETOFDOCUMENTSTYPICALLYTHERESULTOFASEARCHCANBECARRIEDOUTINANUMBEROFWAYSOBVIOUSLY,INORDERTOREFINET

10、HESEARCHSOMENEWINFORMATIONISNEEDED,WHICHCANBEEXPLOITEDTOGIVEACLEARERVIEWOFTHEDOCUMENTSLIKELYTOBERELEVANT33EXTRACTIONITISIMPORTANTTOREMEMBERTHATUSERSARETYPICALLYLOOKINGFORINFORMATIONNOTDOCUMENTSTHEINFORMATIONAUSERREQUIRESMAYBECONTAINEDINALARGERDOCUMENTORINDEEDINANUMBEROFSEGMENTSOFMORETHANONEDOCUMENTT

11、HEINFORMATIONEXTRACTIONTASKAIMSTOCREATEABRIDGEMENTSOFONEDOCUMENTORADIGESTFROMASETOFDOCUMENTSTOPULLOUTFROMTHEDOCUMENTSTHEINFORMATIONFORWHICHTHEUSERISLOOKING34ORGANISATIONHAVINGFOUNDRELEVANTDOCUMENTSANDEXTRACTEDTHEINFORMATIONREQUESTED,THEREQUIREMENTTHENISTOMAKETHEINFORMATIONEASILYACCESSIBLEINFUTURE,BO

12、THTOTHEUSER3ANDPOSSIBLYTOOTHERSTHECLUSTERINGTECHNIQUESMENTIONEDABOVECANBEUSEDTOAUTOMATICALLYCATEGORISEINFORMATIONFOUNDINTORELATEDTOPICSFOREASIERFUTUREACCESSTHESETOFDOCUMENTSCANALSOBEREPRESENTEDIN3DWHICHCANAIDBROWSINGANDSEARCHINGFORDOCUMENTSWHENUSEFULINFORMATIONISFOUND,THEREWILLOFTENBEADESIRETOSHAREI

13、TWITHCOLLEAGUESOROTHERSTHISCANBEAUTOMATED,EGTHEJASPERINFORMATIONAGENTWILLAUTOMATICALLYEMAILUSERSWHENPAGESOFINTERESTTOTHEMAREFOUND35PUSHANDPULLMODELSOFINFORMATIONACCESSUNTILRECENTLY,INFORMATIONHASBEENOBTAINEDFROMTHEWORLDWIDEWEBVIAAREQUESTANDREPLYMECHANISM,ORPULLMODELTHECLIENTINITIATESAREQUESTFORINFOR

14、MATIONANDTHESERVERREPLIESINSOMECIRCUMSTANCES,HOWEVER,THEUSERWANTSTOBENOTIFIEDWHENTHEDATAHASCHANGEDTHISREQUIRESAPUSHINFORMATIONMODELTHEUSERSUBSCRIBESTOINFORMATIONBYPRESELECTEDTOPICAREASANDASINFORMATIONBECOMESAVAILABLEONTHEINFORMATIONPROVIDERSSERVERTHATMATCHESTHEUSERSINTERESTSITISPUSHEDOUTTOTHECLIENTT

15、HISMODELHASOBVIOUSADVANTAGESINAREASWHEREINFORMATIONNEEDSAREWELLKNOWNANDEASILYDEFINEDANDWHEREINFORMATIONMAYBECHANGINGRAPIDLY4PERSONALISATIONUSERPROFILINGANDINFORMATIONFILTERINGONEKEYTOEFFECTIVEINFORMATIONMANAGEMENTISUSERPROFILINGTHEABILITYTOREPRESENTANDREASONABOUTTHEINTERESTSORPREFERENCESOFAUSERUSEOF

16、USERPROFILINGTECHNIQUESWILLALLOWSOFTWARETOAUTOMATICALLYFILTERANDPRIORITISEINFORMATIONFROM,FOREXAMPLE,COLLECTIONSOFINTERNET/INTRANETMULTIMEDIADOCUMENTSORINTHEFUTUREFROMSEVERALHUNDREDCHANNELSOFDIGITALTV41STATISTICALKEYWORDAPPROACHESKEYWORDORTERMMATCHINGISPERHAPSTHEBESTUNDERSTOODAPPROACHTODETERMININGWH

17、ETHERSOMEINFORMATIONISRELEVANTTOAUSERSINTERESTSACOMMONMETHODFORIMPLEMENTINGAKEYWORDMATCHINGSCHEMEISTOUSEAVECTORSPACEMODELVSMSUCHAMODELCONSTRUCTSAVECTOROFDIMENSIONMFOREACHDOCUMENT,WHEREMISTHETOTALNUMBEROFTERMSKEYWORDSUSEDTOIDENTIFYTHECONTENTOFTHEDOCUMENTSINTHESYSTEM42ARTIFICIALINTELLIGENCEANDNEURALNE

18、TWORKSLEARNINGINFORMATIONAGENTSINFERTHEPREFERENCESOFTHEIRUSERSBYUSINGFEEDBACKTO4UPDATETHEUSERPROFILESSOMEOFTHEAPPLICATIONSOFTHISMETHODDESCRIBEDINTHELITERATUREINVOLVEKEYWORDSEARCHINGTHEWWWFORPAGESTHATMIGHTBEOFINTEREST,ANDTHENAPPLYINGAFILTERTOTHERESULTS,PRESENTINGONLYTHETOPPPAGESTOTHEUSERTHISCANEASILY

19、BEADAPTEDTOINCLUDEARELEVANCETHRESHOLDSOTHAT,WHENEVERANEWPAGEISCONSIDERED,ITCANBERATEDANDPRESENTEDIMMEDIATELY,IFRELEVANTALTERNATIVELY,THEPREDICTEDSCOREFORTHEDOCUMENTCANBEFEDBACKTOTHEUSER43SOCIALFILTERINGTHEUSERPROFILINGAPPROACHESEXAMINEDABOVEHAVEALLBEENBASEDONTHEKEYWORDSORTERMSFOUNDINDOCUMENTSANDUSER

20、PROFILESTHESEAPPROACHESCANBEDESCRIBEDASCONTENTBASEDFILTERINGHOWEVER,THEREARETWOMAJORDISADVANTAGESASSOCIATEDWITHALLCONTENTBASEDFILTERINGTECHNIQUESFIRSTLY,THEITEMSTHATAREBEINGFILTEREDMUSTBETEXTDOCUMENTSORSOMEOTHERFORMTHATCANBEPARSEDBYACOMPUTERHENCEITEMSSUCHASSOUNDS,VIDEOCLIPS,IMAGES,ANDSOON,CANNOTBEEA

21、SILYFILTEREDWITHTHESESYSTEMSSECONDLY,CONTENTBASEDFILTERINGHASNOINHERENTMETHODFORPRESENTINGTHEUSERWITHITEMSTHATTHEYDIDNOTKNOWTHATTHEYLIKED,SINCETHEFILTERINGONLYSELECTSITEMSTHATFITTHEDEFINEDUSERPROFILESOCIALFILTERINGOVERCOMESTHESEPROBLEMSITENABLESAUSERTOFILTERTHEINFORMATIONTHATTHEYRECEIVEBASEDUPONTHER

22、ATINGSGIVENBYOTHERUSERSINTHESYSTEMTHISOFTENRELIESUPONCOLLABORATIVEAGENTSWHERETHEUSERAGENTSWORKTOGETHERTOPRODUCERECOMMENDATIONSGENERALLY,SOCIALFILTERINGAUTOMATESTHEPROCESSOFWORDOFMOUTHRECOMMENDATIONSBUTUSESTHERATINGSOFMANYUSERSTOMAKETHESERECOMMENDATIONSMOREACCURATETOAPARTICULARUSERSTASTES5CONCLUSIONS

23、EACHOFTHESYSTEMSEXAMINEDCONTAINSOMEOFTHEATTRIBUTESIDENTIFIEDASBEINGPARTOFACOMPREHENSIVEINFORMATIONMANAGEMENTSYSTEMTHECHALLENGEISTOBUILDASINGLECOHERENTINFORMATIONAGENTINCORPORATINGTHEFUNCTIONALITYREQUIREDTOMEETALLOFAUSERSINFORMATIONREQUIREMENTS5外文文献译文标题网络信息管理资料来源BT技术杂志作者NJ戴维斯和MCREVETT每天数以百万计的人在因特网上使用

24、许多或更多不同的搜索工具搜索信息。他们是否找到他们信息的领域,信息化管理过程中,其中对解决这些问题进行了阐述。用户的信息需求和用户配置文件中利益的代表,都被看作是中央的过程和在这一领域工作,其中包括覆盖一种新型的,非明确的方法来表示型材。在BT实验室开发讨论和一定程度后在系统中接入四个信息,这些目前都是正确的信息正在寻找可能不仅取决于他们的技能,而且还取决于他们的运气。在企业领域,组织越来越多的信息通过内联网。本文着眼于当前的网络信息管理技术的局限性,尤其是在检索,组织和共享都被认为是管理的过程。1介绍每天数以百万计的人在因特网上使用许多或更多不同的搜索工具搜索信息。但他们是否找到他们所寻找有

25、时不仅对他们的技能,而且还取决于自己的运气。研究表明,许多现有的搜索引擎都不能满足用户的需求。2目前的技术一些局限性在当前的信息化管理技术上会遇到许多的问题。大多数问题都围绕难以找到相关信息。简单的关键字查询常常会产生结果太多,质量参差不齐。通常收到几百命中(匹配用户的查询的文件),即使在相对狭窄的查询和接收查询数在千次点击的情况并不少见。研究还表明,用户没有找到很容易的帧需要返回到他们所需要的信息进行查询。3信息的定位和管理过程。信息来源是在规模,复杂程度和数量进行增加,并在上一节所示,当前的信息检索技术是非常大的,多模式,网络信息来源的不足。互联网是一个信息网络的早期范例,未来将会越来越多

26、地进行商业开发。由于拥有大量可利用的信息,分析用户的信息产品和服务的未来将是至关重要的。“大规模定制”定制的服务,服务每一位客户基于顾客的喜好而优先考虑可能是一个关键市场不同的地方。31搜索6问题搜索可能包括一组由用户提供的关键字,它可以自动生成。自动生成的查询的例子是从一个用户的个人资料(也许感兴趣的项目定期搜索该用户),或从一个文件(通常找到类似文件)中产生的。32精致完善一套文件(通常是在搜索结果),可以在许多方面进行。显然,这样完善是需要一些新的信息搜索,它可以被利用来提供一个可能相关的文件且其有更清晰的视野。33提取要牢记用户通常是寻找信息不是“文件”。用户需要的信息可能包含在一个较

27、大的文件或多个文档段。“信息提取的任务旨在创建一套文件一个文件或消化删节拉从文件为用户寻找信息。34组织发现了有关文件,并提取要求提供的资料,然后是使信息更容易在今后访问,无论是用户或给他人。上面提到的聚类技术可以用来自动分类到相关主题,以方便将来访问的信息。文件的集合也可以被描绘在三维可帮助文件,浏览和搜索。当有用的信息被发现,经常会渴望能与他人或同事分享这一信息这可以被自动化,举例说明。JASPER信息代理会自动发送电子邮件当发现用户感兴趣的页面呈现时。35推拉模式的信息访问直到最近,信息已经从万维网获得通过请求和回复机制,或“拉”的模式客户端发起请求信息和服务器的回复。然而,在某些情况下

28、,用户想要的数据已经更改时得到通知。这需要一个“推”信息模型。用户订阅预选主题领域的信息,作为信息提供商的服务器上,用户的利益相匹配的信息变得可用它推至客户端。这种模式的信息需求是众所周知的,容易界定和信息可能会迅速变化的领域让其优势明显。4个性化用户分析和信息过滤一个有效的信息管理的关键是用户分析能够代表和有关用户的利益或喜好的原因。用户分析技术的使用将允许软件自动过滤和优先级的信息,例如,从互联网/企业内部网的多媒体文件的集合,或者在未来几百个数字电视频道41统计关键字的方法关键字(或长期)匹配的是也许是最好的理解的的方法来确定是否是一些有关用户的利益的信息。一种常见的方法实施关键字匹配计

29、划是用一个向量空间模型7(VSM)。这样的模型构造的向量维数M为每个文档,其中M是总数量条款,用于识别系统中的文件的内容(关键字)。42人工智能与类神经网路通过用户使用更新配置文件学习信息代理推断出用户的喜好。一些这种方法的应用,您可能会在文学描述涉及关键字搜索的万维网网页感兴趣,然后应用一个过滤器的结果,提出只有最上面的用户的P页。这可以很容易适应包括相关的阈值,被认为是每当一个新的页面,如果有关它可以被评为立即提出。另外,预测文档的得分可以反馈到用户。43社会过滤功能用户使用上述方法分析研究全部文件和用户配置文件中的关键字或条款的基础上。这些方法可以被描述为基于内容的过滤。然而,与所有的基

30、于内容的过滤技术相关的两个主要缺点。首先,正在筛选的项目必须是文本文件,可以由计算机解析或其他形式。因此,声音,视频剪辑,图片,等等,这些项目不能很容易地通过这些系统过滤。其次,基于内容的过滤,没有固有的方法呈现的用户,他们不知道他们喜欢的项目,因为过滤,只选择适合所定义的用户配置文件的项目。社会过滤功能克服这些问题。它使用户可以筛选,他们收到后,根据系统中的其他用户提供收视率的信息。这往往依赖于一起代理工作的协作代理用户提出建议。一般来说,社会过滤功能字口“建议的过程自动化,但许多用户使用的收视率,使这些建议更准确的确定特定用户的口味。5结论每个系统的检查包括一些属性被认为是一个综合信息管理系统的一部分。目前的挑战是建立一个单一的连贯的信息代理纳入所有的功能要求,以满足用户的信息要求。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 外文翻译

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。