没有合适的资源?快使用搜索试试~ 我知道了~
首页站长百科:SEO入门教程解析
站长百科:SEO入门教程解析
需积分: 50 1 下载量 45 浏览量
更新于2024-07-19
收藏 721KB PDF 举报
本教程是关于搜索引擎优化(SEO)的基础入门指南,由站长百科制作组在2009年3月发布,旨在帮助刚接触搜索引擎优化的新手理解核心概念。教程首先介绍了搜索引擎的基础知识,包括搜索引擎的作用,它被定义为一种用于在网络上查找、索引和提供相关网页的工具。搜索引擎的主要工作原理涉及到蜘蛛(或机器人)的运作,它们通过抓取网页内容并根据算法评估网页的相关性和重要性。 章节一深入解析了搜索引擎的工作机制,如如何分辨搜索引擎的机器人,以及SiteMap在SEO中的关键作用。SiteMap是一种XML文件,用于向搜索引擎告知网站的结构,帮助它们高效地抓取和索引网站内容。教程指导读者如何创建、提交和验证Sitemaps,确保网站的有效索引。 接着,教程讲解了Robots.txt文件,这是网站所有者设定爬虫行为规则的一种方式,通过它可以告诉搜索引擎哪些部分可以抓取,哪些禁止抓取,有助于维护网站的隐私和性能。 作为基础教程,本资源侧重于介绍SEO的基石,包括PageRank等基本概念。然而,作者强调这只是一个起点,后续的内容会涉及更高级的优化策略和技术,会在后续的教程中深入探讨。制作组成员希望读者在享受学习过程的同时,尊重版权,避免商业用途,并鼓励他们持续关注站长百科获取更多关于搜索引擎优化的信息。 这本教程为SEO初学者提供了实用的入门知识,帮助他们在优化网站排名和用户体验上打下坚实的基础,同时也提示了SEO进阶者的未来发展方向。
资源详情
资源推荐
本电子书由站长百科(www.zzbaike.com)教程制作组制作
获取更多信息请访问站长百科 www.zzbaike.com
12
议为您的网站创建 Sitemap。 此脚本可以通过网址列表、网络服务器目录或通过访问日志
创建 Sitemap。 要使用此脚本:
1. 您需要连接到您的网络服务器,并在上面运行脚本。
2. 您的网络服务器需安装 Python 2.2 或更高版本。
3. 您需要知道启动 Python 的命令。 (该命令通常为 python,但可能会因安装不同
而异。) 例如,如果网络服务器安装了两种版本的 Python,命令 python 可调用
较早的版本,而命令 python2 则可调用较晚的版本。
4. 您需要知道指向贵网站的目录路径。 如果您的网络服务器托管一个网站,则路径
可能是 var/www/html 等。 如果您拥有一个托管多个网站的虚拟服务器,路径可
能是 home/virtual/site1/fst/var/www/html 等。
5. 您需要能够将文件上传到自己的网络服务器(例如,使用 FTP)。
6. 如果您要根据访问日志生成一个网址列表,则需要了解用于这些日志的编码,以及
指向它们的完整路径。
Sitemap 生成器可以用于生成常规 XML Sitemap。 不过,一些特殊种类的 Sitemap(如
代码搜索和视频 Sitemap) 有非常独特的要求。 因此,您最好不要使用 Sitemap 生成器
来创建这些 Sitemap。
1.3.4.3 使用第三方工具。
很多第三方提供了可用于创建有效的 Sitemap 的工具。
1.3.5. 使用 Sitemaps 索引文件
您可以提供多个 Sitemaps 文件,但提供的每个 Sitemaps 文件包括的网址不得超过
50,000 个,并且未压缩时不能大于 10MB (10,485,760)。这些限制条件有助于确保 Web 服务器
不会因传输非常大的文件而遇到麻烦。
如 果要列出超过 50,000 个网址,您需要创建多个 Sitemaps 文件。如果预计您的
Sitemaps 网址数量会超过 50,000 个或大小超过 10MB,应考虑创建多个 Sitemaps 文件。如果
您的确提供了多个 Sitemaps,您可以将其列在
Sitemaps 索引文件
中。Sitemaps 索引文件只能
列出不超过 1,000 个 Sitemaps。
Sitemaps 索引文件的 XML 格式与 Sitemaps 文件的 XML 格式非常相似。Sitemaps 索引文
件使用以下 XML 标记:
loc
lastmod
本电子书由站长百科(www.zzbaike.com)教程制作组制作
获取更多信息请访问站长百科 www.zzbaike.com
13
sitemap
sitemapindex
注:Sitemaps 索引文件只能指定与其位于同一网站的 Sitemaps。例如,
http://www.yoursite.com/sitemap_index.xml 可包含位于 http://www.yoursite.com 的
Sitemaps,但不能包含位于 http://www.example.com 或 http://yourhost.yoursite.com 的
Sitemaps。与 Sitemaps 一样,您的 Sitemaps 索引文件应为 UTF-8 编码。
XML Sitemaps 索引示例
下例展示了一个 XML 格式的 Sitemaps 索引。该 Sitemaps 索引列出了两个 Sitemaps:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
备注:与 XML 文件中的所有值一样,Sitemaps 网址需要实体换码.
Sitemaps 索引 XML 标记定义
需要有 <loc> 标记并用其来识别 Sitemaps 的位置。
<lastmod> 标记是可选标记,用于指示相应 Sitemap 文件的修改时间。它并不对应于
该 Sitemap 中列出的任一网页的更改时间。lastmod 标记的值应采用 W3C Datetime
格
式。
通过提供最近修改的时间戳启用搜索引擎抓取工具,抓取工具将只检索索引中的
Sitemaps 的一个子集,也就是说,抓取工具只检索某特定日期之后修改的 Sitemaps。
通过这一递增的 Sitemaps 提取机制,可以快速发现超大型网站上的新网址。
<sitemap> 标记封装单个 Sitemaps 的相关信息。
<sitemapindex> 标记会压缩有关文件中的所有 Sitemaps 的信息。
1.3.6. 验证您的 Sitemaps
Google 使用 XML 架构定义可以出现在 Sitemaps 文件中的元素和属性。您可从以下链接
下载此架构:
本电子书由站长百科(www.zzbaike.com)教程制作组制作
获取更多信息请访问站长百科 www.zzbaike.com
14
对于 Sitemaps: http://www.google.com/schemas/sitemap/0.84/sitemap.xsd
对于 Sitemaps 索引文件:http://www.google.com/schemas/sitemap/0.84/siteindex.xsd
有多种工具可帮助您根据此架构来验证您的 Sitemaps 结构。在下面的每一个位置您都可
以找到 XML 相关的工具列表:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
为了根据某个架构验证您的 Sitemaps 或 Sitemaps 索引文件,XML 文件需要有附加的标
头。如果您使用的是 Sitemaps 生成器,这些标头已经包含其中。如果您使用不同的工具创建
Sitemaps,XML 文件中的标头应如下例所示。
Sitemaps:
<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/sitemap.xsd">
<url>
...
</url>
</urlset>
Sitemaps 索引文件:
<?xml version='1.0' encoding='UTF-8'?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/siteindex.xsd">
<sitemap>
...
</sitemap>
</sitemapindex>
1.3.7.提交 SiteMap
SiteMap 制作完成以后直接传到空间上(只要传到网络上,能访问就行),然后在各个
搜索网站提交。
本电子书由站长百科(www.zzbaike.com)教程制作组制作
获取更多信息请访问站长百科 www.zzbaike.com
15
向 Google 提交网站地图 Sitemap: 通过 http://www.google.com/webmasters 管理提交;
向 Yahoo!提交网站地图 Sitemap: 通过 http://siteexplorer.search.yahoo.com
管理提交;
向百度 Baidu 提交网站地图 Sitemap: 没办法,现在百度不支持 Sitemap。但可通过
http://www.baidu.com/search/url_submit.html
来提交你的网址。百度自行搜索,更新速度很快。
第四节:Robots.txt 介绍
1.4.1.什么是 Robots.txt
robots.txt 是一个纯文本文件,通过在这个文件中声明该网站中不想被 robots 访问的部
分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录
指定的内容。
当一个搜索机器人访问一个站点时,它会首先检查该站点根目录下是否存在 robots.txt,
如果找到,搜索机器人就会按照该文件中的内容来确定访问的范围,如果该文件不存在,那
么搜索机器人就沿着链接抓取。
robots.txt 必须放置在一个站点的根目录下,而且文件名必须全部小写。举例来说,当
spider 访问一个网站(比如 http://www.abc.com)时,首先会检查该网站中是否存在
http://www.abc.com/robots.txt 这个文件,如果 Spider 找到这个文件,它就会根据这个文件的
内容,来确定它访问权限的范 围。
就算已经被 Google 和 Yahoo 收录,也还是有必要用 SiteMap 的,这是为什么呢?有以
下两大原因:
c) 用 SiteMap 有利于搜索引擎更加友好的对网站进行收录,不要让网站的收录有些漏
洞或者收录不全。有了 SiteMap 可以很好的在这方面发挥作用。
d) 有了 SiteMap 并提交给搜索引擎之后,方便你在以后进行下一步的工作,比如对网
站的外部链接和内链错误进行更好的调整,这些都要用到 SiteMap 的提交功能。
因此,SiteMap 的整个作用是不容忽视的。如果你的网站属于下列情况,那么,使用
SiteMap 会特别实用:
A. 网站含动态内容。
B. 网站有不容易被发现的页面,如有大量富 AJAX 或 Flash 内容的页面。
C. 网站为新网站且指向网站的链接不多。
剩余81页未读,继续阅读
zhmy_006
- 粉丝: 36
- 资源: 51
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- zlib-1.2.12压缩包解析与技术要点
- 微信小程序滑动选项卡源码模版发布
- Unity虚拟人物唇同步插件Oculus Lipsync介绍
- Nginx 1.18.0版本WinSW自动安装与管理指南
- Java Swing和JDBC实现的ATM系统源码解析
- 掌握Spark Streaming与Maven集成的分布式大数据处理
- 深入学习推荐系统:教程、案例与项目实践
- Web开发者必备的取色工具软件介绍
- C语言实现李春葆数据结构实验程序
- 超市管理系统开发:asp+SQL Server 2005实战
- Redis伪集群搭建教程与实践
- 掌握网络活动细节:Wireshark v3.6.3网络嗅探工具详解
- 全面掌握美赛:建模、分析与编程实现教程
- Java图书馆系统完整项目源码及SQL文件解析
- PCtoLCD2002软件:高效图片和字符取模转换
- Java开发的体育赛事在线购票系统源码分析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功