• 国家税务总局甘肃省税务局正式挂牌 2019-04-05
  • 世界杯揭幕战-22岁妖星两传一射 俄罗斯5-0沙特迎开门红 2019-04-03
  • 人工智能开发出“穿墙看人”新技术 2019-04-03
  • 春季畜禽养殖 抓好五项措施 2019-03-30
  • 王毅:朝美领导人对话创造新的历史 希望迈出实质性步伐 2019-03-30
  • 宁波专家送医到广西 为河池9名先天肢体畸形患儿施行手术 2019-03-16
  • 端午话诗词,感悟习近平眼中的优秀传统文化 2019-03-13
  • 第四届全国基层党建创新典型案例征集活动启事 2019-03-13
  • 对抄袭行为不能仅道德谴责 2019-03-05
  • 开创国有企业全面从严治党新局面 2019-03-05
  • 温州日报报业集团党委书记、社长方立明祝贺人民日报创刊70周年 2019-02-25
  • 戴森Cyclone V10无绳吸尘器发布 售价4490元起 2019-01-10
  • 当前位置:辽宁35选7开奖结果查询 >  站长 >  搜索优化 >  正文

    辽宁风采35选七开奖结果:「案例解读」解决网站不收录的必备思路

     2019-03-11 16:02  来源:A5专栏  我来投稿

    辽宁35选7开奖结果查询 www.ujwuu.com   各种互联网项目,新手可操作,几乎都是0门槛

    网站不收录可谓说是老生常谈了,太多SEO从业者有遇到这样的问题而无从下手,导致苦恼万分。我们解决网站不收录的问题前,应该思考一个问题:“让网站收录的影响因素都有哪些呢?”,先弄明白这件事情,然后再去解决收录的问题就会变得很有头绪。

    下面我以一个案例的形式针对性的描述下如果一步一步解决网站不收录。

    我在刚加入环球网校的时候,他们的网站已经将近1年的时间在百度的收录少之又少。在我去应聘的时候,CEO知道我在SEO方面有些能力,就令我尽快解决网站不收录的问题。

    首先,我只是听到公司的人和我说这个网站不收录,那到底是哪里不收录、怎么不收录我完全不清楚,所以我开始了数据整理和问题排查的工作。

    将网站按照类型做分类,分为了频道页、列表页、专题页、聚合页以及新闻页5类。然后核技术沟通将这5类URL全部导出给我(新闻页,由于很多考试相关的新闻具有时效性,所以我只导出了30天的数据),然后我按照不同的分类开始收录查询工作。最后收录查询的结果如下:

    如上图,我发现公司人员和我反馈的网站不收录,具体的问题是在新闻页。而环球网校的新闻是面向考试的信息发布、资料发布等。是具有一定时效性的文章,按理说这么大的网站应该秒收才对。

    于是,我和相关人员要了网站最近7天的网站日志,技术给我的是原始的网站日志,既包含了爬虫数据也包含了用户数据等等,没办法,只能自己清洗一下这些数据了。

    SEO清洗网站爬虫日志的流程

    1、我先按照user-agent包含baiduspider的进行过滤,只保留包含baiduspider的数据,这样我就拥有了百度爬虫的数据;

    2、但百度爬虫数据中,也有很多假爬虫,按照ip反查的思路,我先把所有baiduspider的ip地址拿下来,然后去重;

    3、得到600多个不重复的唯一ip地址。我对这些ip地址通过程序批量识别真假爬虫,最后是真爬虫的ip地址有82个;

    4、我再在第一步的所有爬虫数据中进行过滤,只保留ip地址为真的百度爬虫的这82个。最后得到的数据就是真的爬虫数据了;

    5、我将最近7天内发布的url在这个清洗后的日志中进行查询,最后发现所有的新页面在发布后的1分钟内爬虫都有抓取,可想抓取是多么的及时,并且在第二天、第三天都还会有对这篇文章的抓取。

    最终我看到爬虫抓取的行为数据表现很好,应该不是抓取上出了问题。

    然而,在我分析日志之前,也和技术、产品、运维同步了一个需求,我需要1年前网站突然开始不收录那个大概时间节点他们各部门都做了什么改动。就在我分析完日志的晚上,技术老大找到我说,他想起来当年是因为网站被攻击,大量注入了很多的垃圾数据后,网站收录才出现异常的。

    我可能知道问题就出在这里,但为了更全面的考究问题,我还是让他们按规定把之前做的一些改动同步给我。

    第二天早上我就开始围绕网站被攻击的问题与技术进行了彻底的排查,看网站之前被注入的垃圾信息有没有清除干净。最后确认垃圾信息早就彻底清除了,且正确返回了404状态码和404错误页面。

    然后我怀疑是不是百度没有修正我们的状态,被攻击的时候开始不收录正常,毕竟检测到了我们网站的风险,那时隔一年还是如此,一定是百度的问题。我通过百度的反馈中心详细的说明了问题的始末,然后百度的技术也在一直排查,我等了有一周时间没见回复,其他部门也把之前的一些调整和改动都给我了,我也确认那时大家的做法没有问题。

    于是,我主动联系了百度站长平台的朋友,希望他们能够尽快处理,查明问题。

    可最后我得到的结论是百度也没发现什么问题,据说几个部门的技术针对我的问题还各自筛查一遍,没找到问题。好吧,百度的兄弟已经给足了面子,能这么帮咱跟进需求很到位了?;故强孔约?,这毕竟是我入职CEO的第一个托付,一定要搞定。

    我也找了我们的编辑,询问并且检查文章本身的质量问题,大家和几年前一样,一直按部就班的发着信息,没什么变化。及时性、可读性、需求满足度都可以保证。具体是哪出了问题呢?

    我思前想后,会想到问题的本质是开始于网站被攻击开始的,那如果真的是百度没反应过来的话,我就要让百度重新对我的新闻页进行计算,以重新评估这类页面。于是我有了对新闻页改版的念头。

    开始与产品沟通,但他们忙,无奈下,我独挑大梁,自己画原型开干了。

    通过对页面的重新设计、丰富了内链的链接策略,也增加了很多广告自定义的场景。通过20多天的努力,新的页面上线了。

    由于网站每天发布的新闻很多,大约在几百条,所以我写了一个收录查询的程序,每天这个程序都会自动帮我查收录,然后以excel附件的形式发到我的邮箱,我进行查看。

    就在新版的新闻页上线的第4天,收录率从之前每天的1~5个,突然有100多个了,收录率之前都是零点零几,现在有40%多了,又过一天82%,再过一天79%,又过一天85%,就这样80%上下持续了一周的时间,到了下周突然达到了97%,而且是秒收的。然后中间也有个别的天是浮动的。但整体都在95%上下。

    到这,我认为收录问题彻底解决了,很多编辑的同事也早就知道了这个事情。现在几年过去了,我策划的新闻页仍在,且收录情况一直良好。

    下图是我刚查询环球网校最近一天的收录情况:

    时间上有10分钟前、15分钟的。由于你也想查一下的话,而且整体数量也在几百条的数量上。

    那我们来总结一下当网站不收录后的解决这个问题的思路:

    1、锁定网站不收录的是哪类型的页面,就像案例所说,最终我锁定到了新闻页;

    2、思考网站不收录的这个时间点内,对网站有改动权限的人都做了什么,这些改动会不会是网站不收录的原因;

    3、分析网站的日志,看不收录的那个网站类目是不是有抓取,没抓取就是抓取问题,有抓取就不存在问题;

    4、当网站改动上没问题,抓取没问题。就在站长工具反馈中进行详细的反??;

    5、反馈的同时也可以对该类型的模版页面进行适当的调整,例如增加链接入口、增加网页丰富度,新闻页提高原创比例,文章内容的质量程度。

    6、要是还不能收录的话,就对当前类型的模版页面进行大改版,重构页面进行尝试。

    我从业的公司以及帮助一个企业解决网站不收录问题不下15个了,一直沿用这套思路,本文案例网址:(www.hqwx.com)

    责任编辑:陈龙   /   作者:赵彦刚

    申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

    相关文章

    • 详情页怎么做SEO优化?

      今天,赵彦刚与你一起围绕详情页怎么做SEO优化的问题展开讨论一下,也算是分享一下自己多年以来做文章、商品以及图片、电影等流量站的一些SEO的经验。

    • SEO专员日常工作内容有哪些?谈谈seo人员的工作指标

      SEO还有用吗?SEO还有前途吗?经?;嵊龅秸庋奶嵛?,在我看来,能问出这些问题的人大多还是对于SEO有一定的了解但是并没有真正的去坚持或者操作的方法不对造成的。

      标签:
      seo优化技术
    • 导致老网站被降权的原因有哪些?

      在互联网迅速发展,网站数据持续增加的今天,打造一款成功的高质量网站并不容易,需要花费大量的心思和时间,然而费尽心思定制维护的老网站,突然被降权,这会令很多的站长都非常的不解,虽说网站被降权在互联网中并不罕见

    • 网站24小时收录小技巧分享

      现阶段互联网同质非常多,导致很多权重比较低的网站收录很慢,甚至不收录,那么今天我们就来简单分析下作为一个新站或者收录很慢的站,如何12小时内快速收录。

    • URL静态化之网站结构优化基础方法

      我们做网站并不是用来试验各种搜素引擎技术和算法的,那些是黑帽和灰帽的事情,对于安安静静只想当白帽,老老实实做大网站的众多站长来说,稳定是排在第一位的,不要轻易尝试任何新兴的东西,步步为营,哪怕慢别人一点,也比冒着风险去当小白鼠强,所以小编在面对URL是否坚持做静态化时持保守的态度。

    • 网站长期不更新能否做到SEO优化排名稳定?

      不少企业网站从建站公司交付后就没有变动,更没做过SEO优化,所以这些网站也就没有流量,没有排名,甚至搜官网品牌名称都找不到。这是网站本身基础决定的,然而有些网站排名流量稳定,长期不更新会有什么情况呢?

    • 影响着网站排名的17个SEO因素

      哪些seo算法因素在影响着网站排名?为什么同一篇文章发布在两个不同的网站上排名会有特别大的差距?本文将为你一一揭晓。

      标签:
      网站排名
    • SEO的未来:视频与SEO的结合

      视频营销是推广您的业务或产品的好方法。特别是如果你在视频上使用声音。Google可以通过阅读整个(脚本/声音)来帮助你获得排名。

      标签:
      seo优化
    • 新网站如何提交链接让百度更快速的收录

      大家都知道,百度的主要业务是搜索业务,也就是通过网络爬虫抓取大量的互联网数据信息,存储到自己的索引库中,给用户提供索引服务。如何让蜘蛛抓取更多、更优质的页面内容,这是百度需要考虑的。而站长们也希望自己的网站内容能够及时的被百度发现并收录,推出链接提交工具可以用解决这两方面的需求,可谓是一举两得。

      标签:
      百度收录
    • 网站更新的内容在哪里寻找?

      建站的伙伴们都知道,网站是需要长期更新的,可能刚开始我们能写的不尽,可是过段时间终将面临难题,不知道该写些什么内容了。那为什么天虾SEO总是有那么多内容可以写,而你就没有呢?一起来看看我是如何寻找网站内容更新的吧。

    榜单

    热门排行

    信息推荐

    辽宁35选7开奖结果查询
    扫一扫关注最新创业资讯
  • 国家税务总局甘肃省税务局正式挂牌 2019-04-05
  • 世界杯揭幕战-22岁妖星两传一射 俄罗斯5-0沙特迎开门红 2019-04-03
  • 人工智能开发出“穿墙看人”新技术 2019-04-03
  • 春季畜禽养殖 抓好五项措施 2019-03-30
  • 王毅:朝美领导人对话创造新的历史 希望迈出实质性步伐 2019-03-30
  • 宁波专家送医到广西 为河池9名先天肢体畸形患儿施行手术 2019-03-16
  • 端午话诗词,感悟习近平眼中的优秀传统文化 2019-03-13
  • 第四届全国基层党建创新典型案例征集活动启事 2019-03-13
  • 对抄袭行为不能仅道德谴责 2019-03-05
  • 开创国有企业全面从严治党新局面 2019-03-05
  • 温州日报报业集团党委书记、社长方立明祝贺人民日报创刊70周年 2019-02-25
  • 戴森Cyclone V10无绳吸尘器发布 售价4490元起 2019-01-10