百度不收录内页的技巧和最强解决百度抓取出现乱码
入公司差不多一个月,主要负责的是网络营销及网站的SEO优化工作。说实话,公司的网站现状实在让人头痛,主页都放在第四层子目录下,其它页面也类似,放第五层目录下的也有。但让人最头痛是:网站在百度的收录只有5篇,而且全是乱码,网站从2008开始建的,公司的原创信息少说也有上千条,就算百度再不喜欢的话也不可能只收录这么少。这里面结构或者是页面布局肯定存在问题。 于是我制定解决方案:首先是解决乱码的问题,网站的编码是UTF-8,用蜘蛛模拟抓取器抓首页全是乱码,再抓内页也全是乱码,用GB2312抓取更是乱得不行。在各大站长工具网站都试过,不过唯一有例外就是中国站长站抓取首页及内页却不会出现乱码,这更加增加了我的疑惑。 会不会是编码不统一造成的,以前就因为有人用强制的方法把相关页面转换成UTF-8 而造成编码事实上的不统一。于是我就在conn文件名增加了一段代码调用函数,在生成静态页面的同时统一转换成UTF-8至此,蜘蛛抓取乱码的问题得到圆满解决,第二天百度便收录的转成UTF-8不再是乱码的的新首页。深圳LED显示屏也一下跃到了第23名。 其次,是解决收录少的问题,按大多数人的做法,天天更新,坚持原创,然后到A5,SEOWHY高权重的网站发表文章做外链,这招没用,百度不吃这套;于是我又做专题页面,把标题提到首页显示,再到和讯、新浪等主流博客转载发表,百度还是翻白眼。难道百度天生与我有仇,我又用PR6天天更新的行业站和交换友链来来带内页,还是无济于事,百度N久不更新了。 无奈之下刚好遇到了一个同行,真是巧得很,跟他做交换链接时,发现他的老网站跟我现在网站的结构一模一样,而且他的结构是DIV+CSS还比我的站好,跟他说了这个情况,他说用这个网站的模板结构的公司太多了,百度不重视,基本上没什么权重,更不用说收录更新了,他也用尽了多种办法一直无法使收录增多,排名提升。实在没办法,只有重做了一个新站,目前新站相关关键字已经排到了百度首页。是这样的情况吗?我又尝试了一些新办法,还是没什么起色。看来百度特别在意的是你的网页结构,比如同一种程序,那么,就算你内容再怎么修改和原创,百度若是给你权重很低,就很难给你更新快照,相应收录数量就少。治标不治本。只有从根本上改变网站的结构,才是解决百度不收录内页的最好的办法。
CopyRight 2011-2019 JCDNS.COM All Rights Reserved 北京专业建站公司-杰诚网络 服务热线:010-59814526 京ICP备05035226号
杰诚网络专业承接北京建站,北京建网站,提供北京建网站、百度优化相结合的北京建站公司方案,由北京建站公司专业人员结合百度优化经验为您建网站
电话:010-59814526 网址:http://www.jcdns.com