织梦58,打造新闻资讯第一网!

帮助中心 广告联系

房产家居

热门关键词: as  骗锟斤拷  1111  xxx  骗子

Google搜索排名优化-面向搜索引擎的网站设计 (笔记 by 车东)(2)

来源:网络整理 作者:华北互联 人气: 发布时间:2016-09-01
摘要:一篇新闻页面中,搜索引擎如何不通过模板匹配,自动将新闻的主体和页面中的页头,栏目导航条,页尾等部分的内容区分开的? 其实以上问题都可以归结为网页内容摘要的提取策略和关键词在其中的命中: 首先将能够描述

一篇新闻页面中,搜索引擎如何不通过模板匹配,自动将新闻的主体和页面中的页头,栏目导航条,页尾等部分的内容区分开的?

其实以上问题都可以归结为网页内容摘要的提取策略和关键词在其中的命中:
首先将能够描述一个页面内容的分成以下几种类型:

链入文字描述:inbound link text

HTML页面标题:title 好标题一般会将页面中最重要的关键词放在最前面,比如:ABC-10型吸尘器 - XX家电城

HTML内容主体:content text

链出文字:outbound link text

如果按照以下规则:
一个页面中关键词命中权重:链入文字 > HTML标题文字 > HTML页面主体内容 >> 出链文字,以上现象就比较好解释了。
链入文字是页面上看不见的,但链入文字对被链接页面有巨大的作用:在现代搜索引擎在关键词匹配的过程中,匹配的过程不只看当前页面的内容摘要:很大程度 上,不只看这个网页自己说自己有什么内 容,还要看别人如何链接时,如何描述你的网站别人怎么称呼你,比你自己说自己更重要。。
比如查:“世界卫生组织”,返回结果中有 而这个页面中是没有中文的,之所以能匹配上,是因为很多链接它的中文网站使用了:<a xhref="" mce_href="">世界卫生组织</a>,所以,这个页面中不存在的中文关键词也成为了页面摘要 的一 部分。 这样一想,就可以知道链出链接的文字其实是为被链接的子频道首页或者内容详情页服务的。对自身页面的关键词密度只有负面的影响,这也是Google建议一 个页面中链接不要超过100个的原因:他根本不索引100个链接以后的内容。 按照以上规则,搜索引擎将一篇新闻详情页中的新闻内容提取出来就是把页面上所有带HTTP链接的文字都去掉,就是新闻的内容部分了,更精确一些可以通过取 最长文本段落等策略实现; 而很多网站首页或频道首页中几乎全部都是链接,经过搜索引擎分析的结果就是:什么内容也没有,能够被命中的关键词仅仅是别人链接你用的“网站首页”和频道 标题Title中的站点名称等的几个关键词,而页面中其他的文字则远远不如相应子 频道和具体内容页面的匹配度高,而搜索引擎能够通过以上规则,让用户更快的直接定位到有具体内容的内容详情页面。因此希望通过一个首页,尽可能多的命中所 有希望推广的关键词是不可能的。让网页尽可能多的进入搜索引擎的索引,然后把握好整个网站 的主题风格是非常 重要的,让网 站的主题关键词能够比较均匀的按照金字塔模式分布到网站中可以参考:网站的主题 金字塔设计

         网站名称(用户通过1-2个抽象关键词)
         /       \
    子频道1   子频道2 (用户通过2-3个关键词命中)
   /    \      /    \
产品1  产品2 文章1 文章2 (用户通过3-4个关键词命中:这种搜索用户最有商业价值)

不要空着标题:空着<title></title>无异于浪费了最有价值的一块阵地;
不要使用meta keywords
传统的页面中,HTML页面中会有类似以下的隐含信息,用于说明当前网页的主要内容关键字:
<header>
    <meta name="keyword" content="mp3 download music...">
</header>
后来由于这种人工添加关键词的方式被滥用,大量网页中为了提高被搜索引擎命中的概率,经常添加一些和实际网页内容无关的热门关键比如:“music mp3 download”等,所以新一代的搜索引擎已经不再关心页面头文件中的人工meta keyword声明,而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重,如果一个关键词在标题中命中会比在页面中命中有更高的得分,从而 在相应的搜索结果排名中更靠前。meta description的用途主要在于更新在搜索引擎中的摘要:但对排名没有影响。 相同的排名下,可读性更好的摘要对于用户点击也有一点益处,相比之下: 如果摘要全部是页面头部的导航信息,可能不如页面内容本身更吸引用户;

标题长度和内容:不要过长,一般在40个字(80个字节)以内,并充分突出关键词的比重;
如果更长的标题搜索引擎一般会忽略掉,所以要尽可能将主要关键词放在标题靠前的位置。使用:文章标题_类目名称_频道名称。省略掉不必要的形容词吧,毕竟用户主要通过名词来找到需要的内容。标 题内容:尽量用一些别人可以通过关键词找到的字眼(也别太过头,如果标题中的字眼超过1半内容中都没有,有可能被搜索引擎排除出索引),因此基于web日 志中来自其他搜索引擎的关键词查询统计非常必要。而且可以通过搜索引擎的相关关键词发现更多的用户习惯搜索关键词,比如潜在用户更习惯搜索问题的症状,而不是专业术语;

如果网页很多的话,尽量使用不同的网页标题,争取让自己网站的内容更多的进入搜索引擎索引范围;
因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围;
是 我的网站上的一个小应用:一个web界面的unix命令手册(man page),在以前的设计中所有动态页面使用的都是同样的标题:"phpMan: man page /perldoc /info page web interface" ,Google索引了大约3000多个页面,后来我将页面标题改成了"phpMan:  [命令名]"这样的格式,比如:"phpMan: ls",这样大部分动态页面的标题就都不一样了,一个月后Google从这个页面入口索引了大约6000个页面。因此,如果网站中很多网页都使用相同的标 题,比如:“新闻频道”,“论坛”,这些页面中很大一部分就会被排重机制忽略掉。

责任编辑:采集侠
var jiathis_config = {data_track_clickback:'true'};

中国房产家居网

新闻由机器选取每5分钟自动更新

QQ:838869911 邮箱:838869911@qq.com