搜索引擎只是网站的一个普通访客,它抓取网站的方式、对网站/网页的价值判断都是站在用户的角度,任何对用户体验的提升都是对搜索引擎的提升,搜索引擎的优化也会让用户受益。
网站建设针对搜索引擎来说,主要分为三个部分:如何让搜索引擎更好的收录网站的内容,如何在搜索引擎中获得好的排名,如何让用户从大量的搜索结果中点击到你的网站。简单来说就是收录、排序、展示。下面我们分别介绍这三个方面。
不错的收藏
机器可读
百度通过一个名为 的程序来抓取互联网上的网页,并经过处理后构建到索引中。目前只能读取文本内容,暂无法处理flash、图片等非文本内容。百度无法识别放在flash和图片中的文字。
建议用文字代替flash、图片等来显示重要内容或链接,搜索引擎暂时无法识别flash、图片等中的内容,这部分内容无法搜索到;仅含有flash中链接的网页,百度可能无法收录。
我们建议:
• 使用文字代替 flash、图片等来显示重要内容或链接
• 如果必须使用 Flash 创建网页,建议您同时创建文本版本以供搜索引擎索引,并在主页上使用文本链接指向文本版本
• 搜索引擎无法识别的技术(例如 Ajax)只用于需要用户交互的地方。不要将您希望搜索引擎“看到”的导航和文本内容放在 Ajax 中。
• 请勿使用框架和框架结构,显示的内容可能会被百度丢弃
上面的例子中,虽然网页提供了丰富的信息,但是由于这些信息都是在flash中,搜索引擎无法提取出来,对于搜索引擎来说,这个网页是没有内容的。
网站结构
一个网站应该具有清晰的结构和明确的导航,这样可以帮助用户在你的网站上快速找到自己所需要的内容,同时也可以帮助搜索引擎快速了解网站中各个网页的结构层次。
网站结构建议采用树形结构,通常分为以下三个层级:首页-频道-文章页。就像一棵大树,先有树干(首页),再有树枝(频道),最后有树叶(普通内容页)。树形结构的扩展性更强,当网站内容增加时,通过细分树枝(频道)就可以轻松应对。
理想的网站结构应该比较扁平,从首页到内容页的层级尽量少,这样会比较容易被搜索引擎处理。
同时网站还应该是网状结构,网站上每个网页都应该有到上下级网页及相关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接,普通内容页有到上级频道和首页的链接,内容相关网页之间都有链接。
网站上的每个网页都应是网站结构的一部分,并应与其他网页链接。
综上所述,合理的网站结构应该是扁平的树状网状结构。我们建议:
• 确保每个页面至少可通过一个文本链接访问。
•重要内容应该可以从主页或网站结构的较浅层次访问。
•对您网站上的内容进行适当的分类,不要过度细分。
网站应具有简洁明了的导航,既能让用户快速找到所需的内容,也能帮助搜索引擎更好地了解网站的结构。我们建议:
•在每个页面添加导航栏,让用户可以轻松返回到网站本频道或首页,搜索引擎也可以轻松定位网页在网络结构中的层级。
通过面包屑导航,用户可以清楚地知道自己的页面在整个网站中的位置,并且可以轻松返回上一频道或主页。
• 对于内容较多的网站,建议使用面包屑导航,这样可以让用户更容易了解自己当前的位置:首页 > 频道 > 当前浏览页面
• 在导航中使用文本链接,无需复杂的 js 或 flash
• 当使用图像进行导航时,可以使用 Alt 注释来告诉搜索引擎网页的内容是什么。
子域名和目录选择
选择使用子域名或目录来正确分发网站内容将对网站在搜索引擎中的表现产生重大影响。
我们建议:
• 在频道拥有足够多的内容被视为独立网站之前,请使用目录格式;当频道拥有足够多的内容时,将其转换为子域名格式
网页能否排在搜索结果的顶端,取决于其来源,如果来自站点权重较高的网站,则排在顶端的可能性较大,反之则较小。通常主站点权重最高,子站点会从主站点继承部分权重,继承的多少取决于子站点的质量。
在内容丰富到可以成为独立站点之前,将内容放置在主站点下的目录中将会在搜索引擎中获得更好的表现。
• 对于内容差异较大且相关性较低的内容,请使用子网站
搜索引擎会识别网站的主题,如果网站内容相关性不高,可能会导致搜索引擎错误识别,将不相关的内容放在不同的子域名下,可以帮助搜索引擎更好地理解网站的主题。
• 域名之间的权限设置相互分离,无法通过
子域名之间内容可以互相访问,且可能会被搜索引擎视为重复内容而进行去重,保留的URL不一定在正常域名下。
• 不要滥用子域名
滥用大量且内容不丰富的子域名会被搜索引擎视为作弊行为,并受到惩罚。
标准、简单的 URL
创建一个描述性强、规范、简洁的URL,会帮助用户更方便的记忆和判断网页内容,同时也能帮助搜索引擎更有效地抓取你的网站。在网站设计之初,就应该有一个合理的URL规划。
我们建议:
• 如果网站中的同一网页仅对应一个URL
如果一个网站上的多个URL可以访问相同的内容,那么就会存在以下危险:
1. 搜索引擎会选择一个 URL 作为标准,该 URL 可能与真正的 URL 不同
2. 用户可能会对同一个网页推荐不同的URL,多个URL可以分散网页的权重。
如果您的网站已经有多种URL形式,建议按如下方式处理:
1、只使用系统内正常的URL,防止用户访问不正常的URL。
2. 不要在URL中放置统计代码等不必要的内容
3. URL形式不同,301永久跳转为正常形式
4、防止用户输入错误的域名,并启用301永久重定向到主域名。
5.使用.txt禁止抓取不想向用户显示的表单
• 让用户从 URL 判断网页内容和网站结构,并预测将看到的内容
以百度空间为例,URL结构中包含了用户ID信息,因此用户看到空间的URL就能轻易判断出这是谁的空间;URL结构中还包含博客、相册等内容信息,因此用户一眼就能判断出即将看到的内容是博客还是相册。
• URL 尽量短,过长的 URL 不仅不美观,用户也难以从中获取更多有用的信息,但另一方面,短 URL 也可以减少页面体积,加快网页打开速度,提升用户体验。
例子中的第一个URL会让用户望而却步,但是第二个URL,用户却可以轻易判定这是一个论坛里关于百度的讨论区。
•一般的动态URL对搜索引擎没有影响,无论是动态URL还是静态URL对搜索引擎都没有影响,但建议尽量减少动态URL中包含的可变参数,这样可以帮助减少URL长度,降低导致搜索引擎陷入黑洞的风险。
• 请勿添加系统无法自动识别的字符作为 URL 的一部分
上例中,URL中添加了“;”、“,”等字符,当用户通过论坛、即时通讯工具等渠道推荐这些URL时,无法被自动识别为链接,增加了用户访问这些网页的难度。
• 使用百度提供的URL优化工具检查
百度站长平台提供了URL优化工具,可以帮助检查URL对搜索引擎的友好性并提供修改建议。
•网站管理员工具
- URL 优化工具检查
百度站长平台提供了URL优化工具,可以帮助检查URL对搜索引擎的友好度并提供修改建议。
- 网站安全测试
百度站长平台提供工具来检测网站是否被黑客入侵,并向站长提供提示,帮助其进行修改。
♦什么是“网站被黑”?
网站黑客攻击是指黑客利用网站程序、设置中的安全漏洞,或管理员的疏忽(如密码复杂度较低),在未经管理员授权的情况下对网站进行篡改。
♦网站被黑了该如何处理?
1、分析系统日志、服务器日志,检查您网站的页面数量、流量是否有异常波动,是否有异常的访问或操作日志;
2、检查网站文件是否有被异常修改,尤其是首页等关键页面;
3、网站页面是否引用了未知站点的资源(图片、JS等),是否放置了异常的外部站点链接;
4、检查网站是否存在异常增加的文件或目录;
5、检查网站目录下是否有非管理员打包的网站源代码,未知的txt文件等。
♦如何防止你的网站被黑客入侵?
1、定期检查服务器日志,发现问题,检查是否有可疑的非前端页面访问;
2、经常检查网站文件,是否有不正常的修改或者添加;
3.关注所用操作系统及程序官方网站,及时下载补丁程序,修复安全漏洞;必要时建议直接更新至最新版本;
4、修改开源程序关键文件的默认文件名。作弊者通常会利用程序自动扫描某些特定文件的存在来判断是否使用了某个程序;
5、修改默认管理员用户名,提高管理后台密码强度,使用包含字母、数字、特殊符号组合的密码;
6.关闭不必要的服务和端口;
7.禁用或者限制不必要的上传功能;
8.设置防火墙等安全措施;
9、若问题再次出现,建议重新安装服务器操作系统,并重新上传备份的网站文件;
10、对于缺乏专业维护人员的网站,建议咨询专业的安全公司;快速发现、处理被黑内容,防范被黑行为,非常能体现一个网站的运营水平。
以上几点只是初步的参考,要保证网站的安全还需要站长和管理员的持续努力。
• 百度搜索框提示功能
百度向站长免费开放“百度搜索框”代码、“百度搜索框提示”代码。
通过简单的设置,您可以快速将“百度搜索框(带提示功能)”功能添加到您的网页中,提升用户在网站上的搜索体验。
更改域名
网站改版、域名变更在互联网高速发展的背景下是不可避免的,但处理不当会造成很大的流量损失。改版、变更域名首先要考虑的一点就是如何保证老用户不流失,当用户访问旧内容时,可以引导到新网站上相应的内容,避免出现用户无法访问之前收集的网页的情况。
我们建议在改版网页或更换域名时,将旧网页永久301重定向到对应内容的新网页,这样更利于百度感知到变化,并快速将旧网页累积的权重转移到对应的新网页上。
其他建议:
• 除非必要,否则不要彻底改变整个网站的内容
当网站改版或网站重要页面链接发生变更时,应通过301将改版前的页面永久重定向到改版后的相应页面
• 更改网站域名时,应将旧域名上的所有页面通过 301 永久重定向到新域名上的相应页面
更改域名后,尽量保持旧域名稳定,让用户有更多时间记住新域名。
•网站改版/域名更改后,请将新的URL/新域名下的URL提交给百度,以帮助百度更快地发现并做出调整。
合理的返回码
百度爬虫在抓取处理的时候是按照http协议规范来设置相应的逻辑的,所以还请站长们参考http协议中对于返回码含义的定义来进行设置。
百度对于常用http返回码的处理逻辑如下:
•404
404返回码的含义是“”,百度会认为该网页已经过期,那么一般会将其从搜索结果中删除,并且短期内如果发现这个网址就不会再抓取了。
•503
503 返回码的含义是“”,百度会认为该网页暂时无法访问。这种情况通常发生在网站暂时关闭或带宽受限的情况下。对于返回 503 的网页,百度不会直接删除该 URL,而是会在短时间内再次访问。如果届时网页已经恢复,则会正常抓取;如果继续返回 503,则会在短时间内多次访问。但如果网页长时间返回 503,那么这个 URL 仍然会被百度视为死链接,并从搜索结果中删除。
•403
403返回码的含义是“”,百度会认为该网页目前被禁止访问。这种情况下,如果是新发现的URL,百度暂时不会对其进行抓取,短期内会再次检查;如果是百度已经收录的URL,目前不会直接删除,短期内也会再次访问。如果当时允许访问,则正常抓取;如果还是不允许访问,则短期内会反复访问几次。但是如果网页长时间返回403,百度也会认为是死链接,从搜索结果中删除。
•301
301返回码的含义是“”,百度会认为网页当前被重定向到了一个新的URL。当遇到网站迁移、域名变更、网站改版等情况时,建议使用301返回码,尽量减少改版带来的流量损失。虽然现在百度对于301重定向的响应周期变长了,但我们还是建议您这样做。
我们建议:
•若网站临时关闭,网页无法打开时,不要立刻返回404,建议使用503状态,503可以告诉百度该页面暂时无法访问,请稍后重试。
• 如果百度抓取你的网站压力太大,尽量不要使用404,也建议返回503,这样百度过一段时间后会再次尝试抓取该链接,如果当时网站比较空闲,那么就会成功抓取。
•有的网站希望百度只收录部分内容,比如审核之后的内容,积累了一段时间的新用户页面等,这种情况下建议对刚发布的内容暂时返回403,审核或者处理之后再返回正常状态返回码。
•当网站迁移或者更改域名时,请使用301返回。
良好的分类
涵盖网页主要内容的标题
网页标题是用来告诉用户和搜索引擎这个网页的主要内容是什么的,搜索引擎在判断一个网页内容的权重时,标题是主要的参考信息之一。网页标题是对网页上主要内容的概括,搜索引擎可以通过网页标题快速判断网页的主题。每个网页的内容都是不一样的,每个网页都应该有一个独特的标题。
我们建议页面标题具有如下描述性:
•首页:网站名称或网站名称_所提供服务的介绍或产品介绍
• 频道页面:频道名称_网站名称
•文章页面:文章频道名称_网站名称
Title 是指 HTML 文档中的标签,而非文章的标题,它放置在 HTML 文档的标签中,格式如下:
建议做法
• 每个网页都应有唯一的标题。避免所有页面都使用默认标题。
• 标题应清晰且包含此页面最重要的内容
• 简洁明了,不要列出与网页内容无关的信息
•用户通常从左到右浏览,因此重要内容应放在标题的前面
• 使用用户熟悉的语言。如果您的网站有中英文名称,请尽量使用用户熟悉的语言作为标题描述。
良好的内容建设
•网站内容建设要以服务网站核心价值为中心,提供给搜索引擎收录的内容也要对核心价值有帮助。内容建设要与网站主题保持一致。比如你的网站是IT新闻网站,就不要放一堆美女图片,除了浪费服务器资源,对网站核心价值没有任何帮助,看美女图片的人对IT新闻是没兴趣的。
对于某个SNS网站来说,注册用户是其最重要的资源,也是吸引新注册用户的主要依靠,搜索引擎中的姓名搜索是其吸引新用户的重要来源,其向搜索引擎提供的注册用户名资源可以引导搜索引擎用户转化为其注册用户。
• 网站内容应以用户为导向。搜索引擎只是网站的普通访问者。提供符合用户需求的原创内容至关重要。
•撰写好的锚文本
锚文本是指建立链接时使用的描述性文字,用于告诉用户链接所链接网页的主题,锚文本描述越清晰,用户越容易理解所链接网页的内容。
用户是通过其他网页的链接接触到你的网页的,这个链接的描述能否被用户理解,对于吸引用户访问至关重要。和普通用户一样,搜索引擎在第一次发现一个新网页时,锚文本也是这个网页描述的唯一参考因素。
• 为图片添加 alt 描述
当因为网速慢导致图片无法显示的时候,它可以让用户了解图片想要传达的信息,也可以让搜索引擎了解图片的内容。
•可以将资源更丰富的内容以专题等更丰富的内容组织形式提供给用户,让用户以最小的成本获取所需的全部信息。
•Web2.0类型的网站应该充分发挥自身优势,让用户通过投票、评论等方式来判断资源的质量,这些质量判断也可能被搜索引擎用来判断资源的价值。
某个视频网站上投票最多的视频往往质量较高,用户可以参考投票信息,降低筛选成本。
• 管理web2.0等用户生成内容产品,如果被作弊者利用,可能会影响整个网站的权重。
为您的网站赢得用户推荐
互联网上有很多网站提供同样的内容和服务,当内容相同时,哪个网站在搜索引擎中的排名会更高呢?起决定作用的因素就是推荐,我们常说的超链接就是一种推荐。
当你网站上的内容对用户有用时,用户就会向其他人推荐你的网站。推荐的形式多种多样:在即时通讯工具上发给好友、在经常逛的论坛上转发、在博客上认真写介绍、在自己的网站上以友情链接推荐等等。这些推荐信息会被搜索引擎用来判断网页/网站的价值。适当鼓励和引导用户推荐你的网站,对网站在搜索引擎上的表现会有很大帮助。
某视频网站的分享转发功能,让用户可以更加便捷的复制视频,分享给其他用户,大大降低了用户推荐网站内容的成本,让用户更愿意去推荐。
良好的显示效果
引人注目的标题
当用户在百度网页搜索中搜索您的网页时,标题会作为最重要的内容显示在摘要中。主题明确的标题可以帮助用户从搜索结果中更容易判断您的网页内容是否符合他们的需求。
建议做法:
• 标题应清晰且包含此页面最重要的内容
•不要在文章页面标题中添加太多额外描述,因为这会分散用户的注意力。
• 使用用户熟悉的语言
• 如果您的网站用户熟悉,建议在标题的适当位置列出网站名称。品牌效应将增加用户点击的机会。
• 标题应该对用户有吸引力
• 可以让用户感到信任
示例中的网页提供了全国各大城市的天气预报服务,第一个结果采用了百度地图的默认标题,用户无法从搜索结果中判断该网站提供了什么内容,不会点击这个结果;第二个结果的标题明确写明了提供的内容,用户更容易判断,更有可能选择这个结果。
充分利用
它是对网页内容的简洁概括,如果描述与网页内容相符,百度会将其作为概括的选择目标之一。好的描述可以帮助用户从搜索结果中更容易判断你的网页内容是否符合他们的需求。它不是权重计算的参考因素,此标签的有无不会影响网页权重,只会作为搜索结果概括的选择目标。
它是元标记的一部分,位于 HTML 代码区域。
建议做法:
• 最适合网站首页、频道页、产品参数页等没有大段文字可作为摘要的网页。
• 准确描述页面,不要填充关键词
• 为每个页面创建不同的描述,以避免所有页面使用相同的描述
• 长度合理,不会太长也不会太短
在这个例子中,没有应用第一种,而是应用了第二种,可以看出,第一个结果的摘要对用户来说参考价值不大,而第二个结果的摘要可读性更强,可以帮助用户更好的了解网站内容。
扫一扫在手机端查看
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。