网站实际页面和谷歌抓取的内容不一致解决方法
最近更新时间: December 12, 2024
最近网站出了一个问题,网站实际页面和谷歌抓取的内容不一样,即网站页面打开正常,但是在谷歌的搜索结果中却显示的是另外一种内容,并且数量十分巨大。
网站页面的标题,关键词以及描述等所有内容在直接用输入网址打开时都是正常的,但是在谷歌搜索结果中却呈现的是另外一种内容(乱码)。
此外,在谷歌站长工具中,发现该网站的收录量在某个时间段急剧增加,十分诡异。
此时,如果在谷歌站长工具中查看该页面的抓取内容,会发现网站页面显示的是另外一种。
然后又发现网站站点地图也被修改了,里面添加了许多未知的含有错误内容的404页面网址,这应该也是这些错误页面为什么会被轻易收录的重要原因之一。
出现这些问题之后,如果不及时解决整个网站基本上就废了,排名流量几乎都没了,再怎么去做网站优化也不管用。
通过网上搜索以及请教谷歌帮助中心,最终通过以下方法解决了这个问题:
首先可以确定的是网站已经被入侵或者中病毒了,用谷歌帮助中心的人的话来说就是这个病毒会识别用户代理,当识别为正常用户打开网站时,页面会显示原有的正确的内容,但是如果是谷歌爬虫时,则会自动提供另外一种网页内容版本,所以在谷歌搜索结果中才会显示“乱码”。
我们可以通过上图所示的方法(将代理改为Googlebot),修改浏览器代理,就能看到不同版本的网站内容。
在修改网站之前,需要先对完整进行备份,以免重要文件丢失。
- 第一步,我们登录谷歌站长工具中心,查看是否有不认识的所有者,如果有,尽快将其删除。
- 第二步,检查网站配置文件,比如.htaccess,查看里面的代码是否正确,因为黑客经常使用该文件重定向或者创建含有乱码的网页,此外网站的首页模板文件和网站启动页也是黑客经常篡改的文件,同样需要进行仔细排查。
- 第三步,使用工具查杀网站文件中的病毒文件,比如河马查杀等,免费使用,帮助我们找到网站中的危险文件(但也不能完全识别)。
- 第四步,网站备份之后,将原来的网站清除然后重新安装,这样网站中的核心文件可以确保没有病毒,当然如果第三步如果能查出来病毒,并且网站已经正常,这一步也可以省掉。
- 第五步,查看网站地图是否被篡改,修改原来的或者新建一个覆盖掉原来的网站地图,然后在谷歌站长工具中重新提交。
- 第六步,网站中比较重要的页面,比如首页等,在修改之后,需要再次重新在谷歌站长工具中进行提交-请求编入索引,让其重新抓取并收录,这里有一个技巧,在输入网址检查之后,点击“查看被抓取的网页”-“测试实际网址”-然后再“请求编入索引”,这样谷歌中的搜索结果更新的更快。
到此为止,网址已经基本上修复完成,然后需要观察等待查看网站的恢复效果,根据需要进行调整。
参考资料:
版权声明©:希望对您会有所帮助;转载请注明出处。