1、本电子书由聚我咨询 ( 第 1 页SEO 搜索引擎优化基础教程 本教程由聚我咨询( )编整理 整理时间: 2011 年 11 月 16 日 官方网站: 广州聚我咨询 ( )版 权: 聚我咨询本电子书由聚我咨询 ( 第 2 页本电子书聚我咨询 ( )教程制作整理更多学习信息请访问聚我咨询 1 第一章:搜索引擎基础.3 第一节:什么是搜索引擎.3 1.1.1.搜索引擎的作用.3 1.1.2.搜索引擎的定义.3 第二节:搜索引擎的工作原理.4 1.2.1 探寻蜘蛛和机器人.4 1.2.2. 如何辨别搜索引擎机器人身份.5 第三节:SiteMap 介绍.6 1.3.1.什么是 SiteMap.6
2、1.3.2. Sitemaps 文件的位置 .7 1.3.3.XML Sitemaps 格式 .8 1.3.4.创建 SiteMap .11 1.3.5. 使用 Sitemaps 索引文件 .12 1.3.6. 验证您的 Sitemaps .13 1.3.7.提交 SiteMap .14 第四节:Robots.txt 介绍.15 1.4.1.什么是 Robots.txt .15 1.4.2. robots.txt 的语法格式.16 1.4.3. robots.txt 使用技巧.18 1.4.4. robots.txt 用法举例:.19 1.4.5.robots.txt 举例 .20 1.4.6
3、.常见 robots.txt 错误.20 第二章:主要搜索引擎介绍.22 第一节:Google.22 2.1.1 关于 Google.22 2.1.2Google 的 P ageRank 技术.23 2.1.3. Google 的 SiteMap 技术 .24 2.1.4. 网站管理员工具.27 第二节:百度.28 2.2.1.关于百度 .28 2.2.2.百度的 SiteMap .29 2.2.3.百度论坛的开发协议.31 第三节:YaHoo (雅虎).34 2.3.1关于雅虎.34 2.3.2.YaHoo 中国 .35 2.3.3.中文搜索引擎列表.35 第三章:网站的基本查询方式.35
4、第一节:域名查询.35 第二节:收录查询.36 3.2.1. 网站是否被收录.36 3.2.2. 网页收录数量.37 本电子书由聚我咨询 ( 第 3 页第三节:反向链接查询.38 第四节:网站 PR 查询.38 第五节:关键词排名查询.38 本电子书由聚我咨询( )整理更多学习信息请访问聚我咨询 第六节:ALEXA 查询.39 3.6.1. 什么是 Alexa? .39 3.6.2.Alexa 的主要数据 .39 3.6.3.Alexa 的作用 .40 3.6.4提高 Alexa 排名 .40 第四章:搜索引擎优化基础.42 第一节:搜索引擎优化的定义和价值.42 4.1.1 搜索引擎优化
5、的定义.42 4.1.2.搜索引擎优化的价值.43 第二节:搜索引擎优化究竟为了什么.44 4.2.1.SEO 体现网站效果 .44 4.2.2.SEO 的终极目标和实现目标 .44 第三节:白帽 SEO 和黑帽 SEO.44 第四节:关于搜索引擎优化的一些观点.47 4.4.1搜索引擎优化合法吗?.47 4.4.2.会不会和搜索引擎对着干?.47 4.4.3.我的网站有大量的优质原创内容,所以我不需要 SEO 了。.47 4.4.4.SEO 没有技术含量或 SEO 需要很高深的技术.48 4.4.5.大网站那样做了,我也向他们学习.48 4.4.6.SEO 企业或 SEO 工具的保证排名宣传
6、.48 4.4.7.稳定的排名.49 4.4.8.竞争对手无法破坏我的排名.49 第五章:网站设计的优化操作.49 第一节:域名对 SEO 的影响.49 5.1.1.域名的基本常识.49 5.1.2 不同后缀的域名在搜索引擎中的权重.51 第二节:主机对 SEO 的影响.51 5.2.1. 共享主机、独立主机的区别?.51 5.2.2. 主机服务商选择.52 5.2.3.主机服务商转移:.53 第三节:对搜索引擎友好的设计.53 5.3.1. 目录结构 .53 5.3.2.URL.54 5.3.3.导航结构 .55 5.3.4. 框架结构 .56 5.3.5. 图片优化 .57 5.3.6.
7、FLASH 优化 .57 5.3.7.404 错误页设置.57 第四节:网站设计思维.58 本电子书由聚我咨询 ( 第 4 页5.4.1.重视网站结构一致性.58 5.4.2.W3C 浏览器兼容验证 .58 附录 A:搜索引擎优化常用术语 (中英对照) .59 附录 B:网站管理员指南(Google).70 附录 C:百度的建站指导 .73 本电子书由聚我咨询 ( 第 5 页第一章:搜索引擎基础 第一节:什么是搜索引擎 1.1.1.搜索引擎的作用 如果非要列举出搜索引擎能做什么,恐怕没有人可以给出完整的答案。现在的网站用户 大部分是通过搜索引擎进入的,如果用户要购买一件商品,他不知道去那家
8、网上的商店去购 买,他就会去搜索,我们的搜索引擎就是满足足用户的这些需求。 我们都知道,现在的互联网上有大量的垃圾信息,而我们的搜索引擎的作用就是将比较 好的网站,和质量高的网站排在页面的前面,这样用户 就能很快通过引擎找到他们的东西 了,这应该就是引擎的作用。 1.1.2.搜索引擎的定义 给搜索引擎下定义是困难的,有人认为搜索引擎就是百度,有人认为搜索引擎就是 Google,有人认为搜索引擎就是 Yahoo。 如果非要给个定义,就让我们来看看微软大百科 全书(MSN Encarta)是怎么定义搜索引擎的吧: 所谓的搜索引擎(Search Engines)是一些能够主动搜索信息(搜索网页上的单
9、词和简 短的特定的内容描述)并将其自动索引的 Web 网站,其索引内容储存在可供检索的大型数 据库中,建立索引和目录服务。它是一个为你提供信息“检索”服务的网站,它使用某些程序 把互联网上的所有信息归类,以帮助人们在茫茫网海中搜寻到所需要的信息。 第二节:搜索引擎的工作原理 1.2.1 探寻蜘蛛和机器人 搜索引擎要知道网上的新生事物,就得派人出去收集,每天都有新的网站产生,每天都 本电子书由聚我咨询 ( 第 6 页有网站内容的更新,而且这些产生的网站数量、更新的网站内容是爆炸式的,靠人工是不可 能完成这个任务的,所以搜索引擎的发明者就设计了计算机程序,派它们来执行这个任务。 探测器有很多叫法
10、,也叫 Crawler(爬行器)、spider( 蜘蛛)、robot(机器人) 。这些形象的 叫法是描绘搜索引擎派出的蜘蛛机器人爬行在互联网上探测新的信息,Google 把它的探测 器叫做 Googlebot,百度就叫 Baiduspider,Yahoo 称为 Slurp,无论它们叫什么,它们都是人们 编制的计算机程序,由它们不分昼夜的访问各个网站,取回网站的内容、标签、图片等,然 后依照搜索引擎的算法给它们定制索引。 网络蜘蛛通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始, 读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页, 这样一直循环下去,
11、直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。 当抓取到这些网页后,由分析索引系统程序对收集回来的网页进行分析,提取相关网页 信息(包括网页所在 URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时 间、大小、与其它网页的链接关系等) ,根据一定的相关度算法进行大量复杂计算,得到每 一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性) ,然后用这些相关信 息建立网页索引数据库。 建立网页索引数据库后,当用户输入关键词搜索,由搜索系统程序从网页索引数据库中 找到符合该关键词的所有相关网页。因为所
12、有相关网页针对该关键词的相关度早已算好,所 以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 最后,由检索器将搜索结果的链接地址和页面内容摘要等内容组织起来,返回给用户。 1.2.2. 如何辨别搜索引擎机器人身份 搜索引擎派出他们的搜索机器人去访问、索引网站内容,网站管理员也默认、欢迎它们 来访。但是由于搜索引擎派机器人来访会在一定程度上影响网站性能,因此并非所有的机器 人都是无害的,有一些非法机器人伪装成主流搜索引擎漫游器对网站大量遍历,并且不遵循 robots.txt 规范,会严重拖垮网站性能而又无其它益处。因此,网站管理员需要验证每个机器 人身份是否合法。 在你的服务器日志文件中
13、,可见每次访问的路径和相应的 IP 地址,如果是机器人来访, 则 user-agent 会显示 Googlebot 或 MSNBot 等搜索引擎漫游器名称,每个搜索引擎都有自己的 user-agent,但仅有这个还不足以证明这个机器人的合法性,因为很多垃圾制造者可能将他 们的机器人也命名为 Googlebot,以伪装蒙混进入网站,大肆采掘内容。 目前,主流搜索引擎都建议网站管理员通过这种方式来辨别真实的机器人身份:通过 DNS 反向查询找出搜索引擎机器人 IP 地址对应的主机名称;用主机名查找 IP 地址以确认该主 机名与 IP 地址匹配。 首先,使用 DNS 反向查询(Reverse DNS
14、 Lookup) ,找出机器人 IP 地址对应的主机名称。 主流搜索引擎的主机名称通常情况下应是这样的: . Google : 主 机 名 称 应 包 含 于 域 名 中 , 如 : crawl-66-249-66-; . MSN : 主 机 名 称 应 包 含 于 域 名 中 , 如 :livebot-207-46-98-; . Yahoo:主机名称应包含于 域名中,如:。 最后,做一次 DNS 查询,用主机名查找 IP 地址(Forward DNS Lookup) ,以确认该主机 名与 IP 地址匹配。由此证明该机器人是合法的。 现在,如果发现一个机器人将自己伪装成合法搜索引擎漫游器
15、,你就可以通过服务器上 的设置来阻止这个非法机器人。 本电子书由聚我咨询 ( 第 7 页第三节:SiteMap 介绍 1.3.1.什么是 SiteMap Sitemaps 协议使你能够告知搜索引擎网站中可供抓取的网址。最简便的方式就是,使 用 Sitemaps 协议的 Sitemaps 就是列有某个网站所有网址的 XML 文件。此协议可高度扩 展,因此可适用于各种大小的网站。它还能够使网站管理员提供有关每个网址的其他信息(上 次更新的时间、更改的频率、与网站中其他网址相比它的重要性等) ,以便搜索引擎可以更 智能地抓取该网站。 Sitemaps 在用户无法通过可浏览界面访问网站的所有区域时作
16、用尤其明显。 (通常, 指用户无法通过追踪链接访问网站的特定页面或区域。 )例如,那些只能通过搜索表单才能 访问其中某些页面的网站都会从创建 Sitemaps 并将其提交到搜索引擎中获益。此文件说明 Sitemaps 文件的格式,并解释您张贴 Sitemaps 文件的位置以便搜索引擎能够检索到。 请注意 Sitemaps 协议补充而不是取代搜索引擎已用来发现网址的基于抓取的机制。通 过向搜索引擎提交一个 Sitemaps(或多个 Sitemaps) ,可帮助搜索引擎更好地抓取您的网 站。 就算已经被 Google 和 Yahoo 收录,也还是有必要用 SiteMap 的,这是为什么呢?有以 下
17、两大原因: a) 用 SiteMap 有利于搜索引擎更加友好的对网站进行收录,不要让网站的收录有些漏 洞或者收录不全。有了 SiteMap 可以很好的在这方面发挥作用。 b) 有了 SiteMap 并提交给搜索引擎之后,方便你在以后进行下一步的工作,比如对网站的外部链接和内链错误进行更好的调整,这些都要用到 SiteMap 的提交功能。 因此,SiteMap 的整个作用是不容忽视的。如果你的网站属于下列情况,那么,使用 SiteMap 会特别实用: A. 网站含动态内容。 B. 网站有不容易被发现的页面,如有大量富 AJAX 或 Flash 内容的页面。 C. 网站为新网站且指向网站的链接不多
18、。 D. 网站有大量内容页存档,这些内容页相互没有很好地链接,或根本就没有链接。 E. 网站上网页的更改频率。 F. 各网页上次修改的日期。 G. 您网站上各网页的相对重要性。 如果你的网站出现上面介绍的情况,那么,你就需要创建 SiteMap 了。 1.3.2. Sitemaps 文件的位置 Sitemaps 文件的位置决定该 Sitemaps 中所能包含的一组网址。位于 http:/ 的 Sitemaps 文件可包含以 http:/ 开始的任何网址,但不能包含以 http:/ 开始的网址。 如果您有更改 http:/example.org/path/sitemap.gz 的许可,您应该也可以提供以 http:/example.org/path/ 作为前缀的网址的信息。 http:/ 中,被认为有效的示例网址包括: http:/ http:/ 单引号 双引号 “ 大于 小于 XML 标记来识别。此示例中,为每个网址提供了一组不同的可选参数。 http:/ 2005-01-01 本电子书由聚我咨询 (
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。