正确使用heading标签

 

 

 

 

使用heading标签来强调重要的文字

 

Heading标签(请不要将其和HTML <head>标签或者HTTP 标头混淆)通常用来为用户呈现网页的结构。HTML语言里一共有六种大小的heading标签 , 从最重要的<h1> , 到<h6> , 权重依次降低(1)。

 

由于heading标签通常会使某些文字比普通的文字大 , 对于用户来说 , 这样可以便于他们更直观地看出这些文字的重要性 , 而且可以帮助他们理解heading文字下方的内容。多种渐变大小的heading可以为

您的内容创建分层结构 , 从而使用户更容易地浏览您的网站。

 

 

 

 

 

</head>

 

 

<body>

 

<h1>Brandon’s Baseball Cards</h1>

 

 

<h2>News – Treasure Trove of Baseball Cards Found in Old Barn</h2>

 

 

<p>A man who recently purchased a farm house was pleasantly surprised …

 

dollars worth of vintage baseball cards in the barn. The cards were … in news papers and were thought to be in near-mint condition. After … the cards to his grandson instead of selling them.</p>

 

(1)在一个新闻页面 , 我们可能需要将网站名放入<h1>标签 , 将新闻标题放入

<h2>标签。

 

 

 

 

 

 

 

 

 

Heading标签对于吸引

用户眼球很重要 , 请仔

细使用之!

 

 

 

 

 

最佳使用方法

 

想象您正在写一份提纲

 

就像在一张纸上写一份提纲一样 , 找出页面上的要点和分要点 , 然后决定怎样恰当地使用heading标签。

 

请注意避免 :

把不能帮助用户理解页面结构的的文字写进heading标签

一味地使用heading标签 , 实际上有些时候<em>标签和<strong>标签可能更适合

 

不根据内容的改变而随意地调整heading标签的大小

 

适度的使用heading标签

 

只在适合使用heading标签的地方使用它。当一个页面上有过多的heading标签 , 会对用户浏览内容和分辨出某个标题的起始带来不便。

 

请注意避免 :

通篇过度地使用heading标签

把页面的所有文字都放进heading标签

 

把heading标签误作为丰富文字形式的手段 , 而不是用来展示内容的结构

 

  词汇表          
  HTTP标头     通配符      
  HTTP(超文本传输协议)中 , 在发送实际数据本身前发送的各类数据。 用于替代其他任何字符或字符串的字符(*)。
             
  <em>         .htaccess
  用于表示强调的HTML标记。根据相关标准 , 此标记会通过使用斜体表示强调。 超文本访问文件 , 一种可让您管理网络服务器配置的文件。
         
  <strong>       引用页日志
  用于表示重点强调的HTML标记。根据相关标准 , 此标记会通过使用粗体表示强调。 写入访问日志的引用页信息。用户可以通过跟踪该日志 , 了解访问者查看过的网站。
                   
                   
                   

 

 

 

20

 

 

 

 

 

 

处理页面的抓取

 

更加有效地使用robots.txt文件

 

 

 

 

 

 

 

 

 

 

 

用robots.txt文件来限制抓取

 

“robots.txt”文件主要用来告知搜索引擎它们是否有权抓取您网站

 

的特定部分(1)。该文件一定要严格的命名为“robots.txt” , 并被放置在网站的根目录下(2)。

 

您可能不希望您的网站中的某些页面被抓取 , 也许这些网页在搜索结果中出现对于用户来说并没多大用处。如果您想防止搜索引擎抓取这些页面 , 谷歌网站站长工具中有一个非常好用的robots.txt生成器 , 它可以帮您生成这个文件。需要注意的是 , 如果您的网站使用子域名而您不想被抓取的某些网页恰好在一个特定子域名下 , 您需要为那个子域名创建一个单独的robots.txt文件。如果您想了解更多的关于robots.txt的信息 , 建议您参阅网站管理员帮助中心的关于使用robots.txt文件的指南。

 

还有很多别的方法可以保证您的网站的某些内容不出现在搜索结果中 , 比如说给您的robots元标签加上“NOINDEX”标识 , 使用

 

.htaccess文件对需要保护的目录加密 , 还可以使用网站站长工具将已经被抓取的网页从搜索结果中移除。Google工程师Matt Cutts 在视频中对如何从Google索引中删除内容进行了介绍(英语)。

User-agent : *

 

Disallow : /images/

 

Disallow : /search

 

(1)任何的搜索引擎(通配符*规定的)都不能够接近或者抓取/images/下的内容或者任何的以/search做为路径开头的URL。

 

 

 

(2)robots.txt的文件地址

 

 

 

 

 

 

 

 

 

掌握如何设置需

要抓取和不需要

抓取的内容!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

最佳使用方法

 

对敏感的内容使用更加安全的方法

 

您可能不会特别放心仅仅使用robots.txt对敏感的或者保密的内容进行屏蔽。其中一个原因是如果网络上还有一些链接链向这些URL时(比如引用页日志) , 搜索引擎仍然有可能跟踪抓取到您希望屏蔽的URL , 当然 , 它们只会展示您的URL地址信息 , 而不会展示标题或者内容摘要。一些无赖的搜索引擎可能并不会自觉遵守机器人排除标准从而违反您的robots.txt的说明。还有其他原因 , 比如一个好奇的用户可能查看了您robots.txt文件中的目录和子目录 , 并对您不愿对外界展示的内容的URL进行了猜测。使用.htacess文件对内容进行密码保护或者对内容加密是更加安全的措施。

 

请注意避免 :

允许您网站中一些类似搜索结果的页面被抓取到(用户不喜欢刚离开一个搜索结果页面就进入了

另一个搜索结果页面 , 这对他们来说没有什么价值)

 

允许大量自动生成的、有相同或极为相似内容的网页被抓取到 , 用户会想 : “难道这100000页近乎相同的网页真的应该在搜索引擎的索引中出现吗?”

允许那些因提供代理服务而生成的URL被抓取

 

 

 

 

        相关链接  
  机器人排除标准   robots.txt生成器
  一种规范 , 用于阻止协作网络“蜘蛛”程序/抓取工具(例如Googlebot)访问网 http://www.google.com.hk/ggblog/googlewebmaster-cn/2008/03/blog-post_30.html
  站的全部或部分内容 , 而这些内容是可供用户通过其他方式公开查看的。 使用robots.txt文件
  代理服务     http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=156449
           
  在内部网络和外部网络需要建立连接的情况下 , 用于替代相关连接的计算 如何从Google搜索引擎中删除内容
  机 , 或可发挥此作用的软件。 http://googlewebmastercentral.blogspot.com/2008/01/remove-your-content-from-google.html

 

 

 

 

 

 

 

 

 

 

广