1、最危险的搜索关键字对于许多互联网用户来说 Google 是不可替代的,绝大部分浏览器默认的搜索引擎都是 Google,甚至首页也是 Google 搜索引擎。因而对于网络犯罪分子来说,无论是散发恶意程序还是实施诈骗,Google 搜索引擎都是最佳的途径。如何让互联网用户在搜索的时候被带到散播恶意程序和显示诈骗信息的网站上来,是网络犯罪分子最为关注的问题,而如何有效地过滤这些可能存在危险的网站,则是 Google 公司考虑的问题。 在我们的研究中,我们没有包含色情和软件破解相关的搜索和网页,因为在类似的网页上存在恶意程序基本上是一个没有悬念的问题,访问类似的网页感染恶意程序的风险非常高,这一点不需
2、要我们去研究证明。此外,我们只检查搜索结果的第一个页面,根据德国联邦数字经济协会和美国康奈尔大学过去几年的所谓眼球追踪研究表明,互联网用户通常只会查看搜索结果的第一个页面及其上的广告。大部分甚至只会点击顶部的链接,根据不同的搜索目的,点击第一个搜索结果的机率在 20%60%之间,而第四个搜索结果被点击的机率则不足 5%。当然,这些数字或许并不非常准确,因为它们受到很多因素的影响,不过它们足以证明,绝大部分人在使用 Google 搜索引擎时,只会点击前几个搜索结果,因而,我们只检查搜索结果的第一个页面并不影响对危险关键字的研究。 通过 Google 搜索引擎可以很容易地欺骗缺乏相关知识的互联网用
3、户,因而,网络罪犯都会通过用不可见的文字不断重复关键字、在其他网站购买链接(以提升 PageRank)等各类技术来提高自己的网站在搜索结果中的排名,特别是一些流行的搜索关键字,搜索结果被操纵的可能性更大。据卡巴斯基的病毒分析师基思顿芬克介绍,最危险的是全球性热门事件的关键字,例如自然灾害或者一个受欢迎演员的死亡和丑闻及一些总是很热门的关键字,例如热门电影、音乐和游戏,特别是当这些关键字和“免费”之类的词汇组合在一起时。 搜索结果中包含病毒的网站 我们的测试结果证实了卡巴斯基的病毒分析师基思顿芬克所说的情况,当我们搜索“Breaking Bad Stream”(绝命毒师 (Breaking Ba
4、d)是一部热播的美国电视连续剧,搜索“Breaking Bad Stream”相当于在中国搜索在线播放的某部热播的电视连续剧)时,搜索结果中的网站有的要求我们下载一个播放器才能够在线播放该电视剧,而下载的实际上是一个木马程序。此外,即使我们只是希望下载壁纸和屏幕保护程序,在使用 Google 搜索引擎搜索并下载的过程中,搜索结果中的网站为我们的浏览器提供了 5 个不必要的插件,并在我们的系统上添加了 3个自动启动项。 在测试过程中,我们发现的恶意程序主要是恐吓软件,例如假的防病毒软件,软件将提示发现病毒,并要求我们购买一套软件以清除发现的病毒。另外,其中一些恶意程序在安装之后导致系统崩溃或者浏
5、览器无法正常工作。然而,我们并没有在访问网站时受到直接的病毒攻击,这些恶意软件都隐藏在网站上提供的下载资源中。因此,或许我们不能够因而指责 Google,毕竟检查搜索结果中网站的所有下载资源在技术上几乎是不可能的。 搜索结果中存在的安全隐患除了恶意程序之外,另一个大问题是诈骗,特别是当使用涉及金钱的关键字进行搜索时,例如“贷款”或者“低价机票”之类的搜索,我们将发现许多可信度值得怀疑的结果。以特价机票的相关搜索为例,实际上许多提供这种机票的网站都是通过额外服务获利的,例如附加旅游、保险之类的服务。 Google 算法的弱点 犯罪分子为了使传播病毒或者诈骗网站出现在相关搜索结果的首页,他们必须想
6、办法操纵搜索引擎的搜索结果。Google 通过 Googlebot 之类的程序抓取并索引的网站约 600 亿个,并通过一个复杂的算法来决定搜索结果的排序。该算法涉及 200 多个因素,而最主要的因素是有多少网站以相关的文字链接目标网站,简单地说,Google 认为衡量一个网站与某一个关键字的关联性,通过其他网站链接数量多寡排名更客观。 事实上,这一奇思妙想是 Google 击败其他搜索引擎的关键,但是不久之后网络犯罪分子就想出了一些方法来骗过 Google 的算法,他们在其他网站的网页或者社区论坛上大量地发布链接,甚至特意建立所谓的“链接农场”网站来提供反向链接,在这种情况下,Google 算
7、法的准确性开始受到影响。不过,Google 很快调整了算法,新的算法中影响一个网站排名的不再只是反向链接的数量,反向链接来源的可信度、信誉或权威程度也成为了一个重要因素。 在发布垃圾信息和建立垃圾网站操纵搜索引擎排名的办法不再那么有效的情况下,网络犯罪分子开始攻击可信度、信誉或权威程度高的网站,在这些网站上发布自己的链接,甚至篡改网站的内容,以达到操纵Google 搜索引擎的目的。这种做法一般人可能会认为很难实现,但是事实上实施起来并不难。这是因为现在的网站大多依赖内容管理系统(CMS)进行更新维护,内容管理系统上通常可以通过安装插件实现更多的功能,而无论是网站服务器的软件,还是这些包含大量第
8、三方代码的内容管理系统,都会出现可以被黑客利用的安全漏洞。例如热门的开源内容管理系统 WordPress 和 Joomla,根据世界上最著名的源代码安全扫描软件 Checkmarx Cx Suite 的生产商 Checkmarx 的研究,其中约有 70个很容易受到网络攻击的电子商务插件。 实际上,黑客可以通过搜索引擎,很轻松地在互联网上找到使用某种内容管理系统的网站,也可以找出版本过时或者存在安全漏洞的内容管理系统,因为内容管理系统上相关的信息直接以文本形式显示在网页上,这些内容将包含在 Google 的索引之中。另一种方法是通过网站上存在的编程漏洞,特别是对输入的内容没有谨慎处理的程序,实施
9、注入式攻击。另外,由于现如今几乎所有的网站都通过内容管理系统进行管理,黑客也会尝试暴力破解网站管理员的访问账户,或者对网站管理员实施钓鱼攻击,诱骗他们透露账户信息。根据专门从事网站安全研究的Sucuri 公司的介绍,这样的攻击在使用 WordPress 和 Joomla 的网站上非常猖獗。 搜索引擎与垃圾内容的斗争 无论是否传播恶意程序,任何操纵搜索引擎排名的行为对于搜索引擎的用户来说都不是好事,因为这意味着相关度更高的网站会被不相关的结果所淹没。目前,Google 每周标识的垃圾网站高达 5 万个,这些网站的网页上都包含操纵搜索结果的恶意代码,而传播恶意程序的网站约 5 000 个。至于通过
10、 Google 的广告服务(AdWords)发布的这类网站Google 没有提供统计数据,在我们的测试过程中,不时也在广告上发现有可疑或者危险的网站出现,主要以实施诈骗的网站居多。 Google 目前正试图通过鼓励用户投诉的方式来打击对广告服务的滥用行为,此外,Google 也使用算法来分析和找出 AdWords 中的欺诈广告,例如分析广告文本、检查广告链接的网站和发布该广告的账户活动情况,存在滥用行为的网站可能被 Google 封锁,广告服务账户可能被永久关闭。Google 也同样通过算法来检测垃圾网页并自动降低其排名或者直接删除该网站,但是垃圾网站的形式多种多样,检测起来并不容易。部分垃圾
11、网站使用了较为狡猾的垃圾网站技术,此前,垃圾网站甚至会通过一些看似是输入错误的字符去影响 Google 的索引查询,例如使用“Fotoschop”而不是“Photoshop” 。但是由于 Google 已经在搜索字段中增加了自动纠正输入错误的功能,所以随着时间的推移,类似的垃圾网站已经越来越少。不过,另有一些特别狡猾的垃圾网站会自动生成一些莫名其妙的内容,索引程序很难正确地对其进行判断,为此,Google在许多国家建立了手动反垃圾内容小组,负责检查索引程序认为可疑和其他用户举报的网站,手动对这些少数垃圾内容进行标识。 为了对坑垃圾网站,Google 需要不断地更新和调整算法,熊猫(2011 年
12、 4 月)和企鹅(2012 年 4 月)是两次影响比较大的更新。通过这两次更新,Google 击倒了无数依靠发布垃圾内容经营“链接农场”的搜索排名优化服务商,因为从这些“链接农场”上提供的反向链接不再能够改善网站的评级。 Google 如何反垃圾内容 我们采访了在都柏林的 Google 德国搜索质量团队的斯文瑙曼、乌利卢茨和约翰内斯梅勒姆(照片左起) 。他们负责支持网站的运营并努力地改进搜索结果,包括对抗垃圾网站等。 我们的测试表明,Google 的搜索结果存在垃圾网页,甚至是恶意程序的网站,这是否因为垃圾内容的发布者掌握了更有效的搜索引擎优化技术? 是的,发布恶意程序的人是非常努力的,他们会
13、挖空心思地影响搜索引擎以求在搜索结果中出现在较前的位置。不过,即使这些网站在一段时间内没有引起我们的注意,但是我们可以向你们保证,我们会非常谨慎地处理这些网站,以确保我们的用户免受垃圾网站和恶意软件的影响。自 2006 年以来,Google 已经开始扫描恶意软件,并将它们标记出来,这样我们可以避免每周数以亿计的用户无意中访问了传播恶意软件的网站。相关的信息发布在我们的在线安全新闻博客上,另外,在 Google 的搜索前沿( 近年来,Google 通过企鹅更新和熊猫更新两次大幅度修改搜索算法,这些更新如何有效避免垃圾网站出现在搜索结果中? 熊猫和企鹅这两个更新主要通过减少低质量的网站和垃圾网站的
14、能见度来改善搜索结果,不过虽然这两次更新引起了极大的关注,但是实际上我们每年改动搜索引擎算法大约 500 次,不断地改善搜索结果和对抗垃圾网站。 Google 通过什么样的方法来避免搜索结果中垃圾内容的侵扰? 除了依赖我们的国际化团队跟踪垃圾网站的新技术和新趋势以不断地更新改进算法之外,我们也鼓励 Web 站点管理员创建搜索引擎友好的网站,并采取对抗黑客攻击的预防措施。为此,我们特意建立了一个网站站长网站( ,提供相关的技术文档、博客、论坛和网站管理员工具。 网络罪犯正越来越多地利用被操纵的网站来传播恶意软件,Google是如何解决这个问题的? 我们努力提高算法来检测被操纵的网站,不过这不是一
15、件容易的事情,因为黑客和垃圾内容的发布者大多了解相关的技术诀窍,而且他们对于违反法律没有任何顾忌,并努力地掩饰自己的踪迹。同时,我们与诸如 stopbadware.org 之类的安全机构合作,帮助用户避开可能有潜在危险的网站。最后,要解决这一问题,实际上更多的是需要依赖网站的管理员,只有在他们完成好自己的工作以确保网站的安全才是根治的方法。为此,我们为网站管理员提供详细的技术文档以及其他的一些网站管理工具。 这些机制如何能够帮助 Google 搜索引擎的用户放心地上网冲浪? 为了更好地保护我们的用户,我们会在用户进入可能存在问题的结果页面时给出相应的警告提示。此外,我们的浏览器用户在点击可疑的
16、链接时也会出现警告,这些都是通过 stopbadware.org 的数据实现的功能。目前,我们每周搜索结果页面的警告信息显示次数超过 4 000 万次,浏览器的警告信息约 20 亿次。 Google 搜索的危险所在 在不包含色情和软件破解相关搜索的情况下,我们分析了几十个关键字在 Google 进行搜索时恶意程序和诈骗信息的情况。在测试过程中,我们使用链接扫描器 WOT 和 Bitdefender TrafficLight 检查了搜索结果第一页中包括广告在内的所有链接,测试当我们打开网站并下载目标文件的情况下可能出现的问题。在下面的表格中,我们列出了测试结果中最危险的搜索关键字所出现的问题。
17、Google 搜索中的黑客网站 Google 每个星期封锁数万个被黑客操纵用于传播垃圾邮件和恶意软件的网站,而专门被创建用于类似目的的网站则相对较少。 阻止垃圾网站 设置基本保障措施 首先,我们必须确保 Windows 能够及时更新,并且安装一套病毒防御软件。通常,功能比较完善的病毒防御软件都提供一些互联网安全工具,例如赛门铁克的安全套件中将包含浏览器插件在内的防御工具,它能够帮助我们规避搜索结果中存在的危险。 使用链接检查工具 我们可以为浏览器安装链接检查工具,WOT 可以帮助我们分析网站的可靠性,这能够在一定程度上帮助我们避开准备实施诈骗的网络犯罪分子。而 Bitdefender Traf
18、ficLight 能够实时地对搜索结果中的网站进行分析,马上提示搜索结果中的网站是否存在安全隐患。如果不希望安装额外的工具,那么对于可疑的链接,我们可以通过“”进行检查。 激活插件保护 要避免垃圾网站影响我们的浏览器,激活插件保护功能是一个行之有效的方法。Chrome 和 Firefox 都支持这一功能,但遗憾的是 IE 浏览器没有该功能。在 Firefox 地址栏中输入“about:config”并打开页面,进入设置页面后查找“plugins.click_to_play”并激活设置。Chrome 用户可以点击右上角按钮,选择“设置” ,然后点击“隐私”下的“内容设置”按钮,在打开的对话框中查
19、找“插件” ,并选择“点击运行” ,激活该选项后,运行插件时将需要我们手动进行允许。 清除垃圾内容 使用脱机扫描 如果怀疑系统受到了病毒攻击,那么我们可以先切断互联网连接,关闭电脑。在一台安全的电脑上下载一个 Kaspersky Rescue Disk(http:/ ,刻录卡巴斯基救援光盘,或者制作卡巴斯基救援闪存盘,使用卡巴斯基救援盘启动怀疑有问题的电脑,选择语言并启动图形模式,即可在脱机状态下对系统进行检查,扫描可能存在的病毒。 清除浏览器加载项 如果浏览器被安装了不必要的工具栏或者插件,那么我们可以下载一个浏览器加载项清除工具 Avast Browser Cleanup(http:/ ,下载后直接运行,软件即可自动对当前系统上安装的浏览器进行检查,在检查结果中单击“删除所有插件”或者指定插件后面的“删除”按钮,即可删除所有加载项或者我们认为可疑的加载项。 重置浏览器 设置被恶意修改的浏览器,通常很难全部进行更正,不过,我们可通过直接重置浏览器设置来解决问题。Firefox 用户在地址栏中键入“about:support”并打开,单击右上角的“重置 Firefox”按钮即可实现重置;在 Chrome 中,我们可通过“设置|显示高级设置|重置浏览器设置”来完成这项工作;在 IE 中我们可按ALT+X快捷键打开工具菜单,并通过“Internet 选项|高级|重置”来完成这项工作。