1、使用CSS定义文字字体、颜色、尺寸及也卖弄排版。有很多网站即使用CSS,又在可见文字部分用style或font再定义一遍字体、尺寸等,这是完全没必要的冗余代码。 2、使用外部文件。将CSS和JavaScript放在外部文件中,页面HTML中只要放一行调用代码即可。我们可以看到有很多网页HTML代码中存在CSS样式和JavaScript语句,这些东西明显是蜘蛛不喜欢的,最主要的原因是由于代码大多放在文字前面,造成的后果就是蜘蛛需要经过这些代码然后到达文字部分,影响蜘蛛心情不利于蜘蛛抓取。 3、减少或删除注释。代码中的注释只是给程序员或页面设计人员提示作用,对于搜索引擎或者用户来说毫无作用,没必要留下。 4、减少表格,尤其是嵌套表格。当然现在的页面大多使用CSS排版,表格使用大大减少。但有的时候使用表格展现是必需的,也不必刻意完全避免,只要不出现多层表格嵌套,产生大量无用代码是不会有什么问题的。 这里说明一下文件大小限制。网页瘦身需要对整体文件作一个规格限制,Google技术指南曾经建议,HTML文件最好限制在100KB一下,当然这个原因主要也是考虑到搜索引擎索引方面,另外考虑到网页打开速度方面。页面上链接数在100个一下,这个目前没有严格限制。百度目前建议HTML文件不要超过128KB。 其实搜索引擎完全可以抓取大得多的文件,甚至一两兆的文件也没问题。不过在可能的情况下,还是尽量使用越小越好的文件。虽然搜索引擎可以抓取很大的文件,但是不可能索引整个文件,也只索引文件前面一部分内容。通常页面内容应该是集中统一的,索引前半部分就代表了文件内容主题。文件很大时,索引整个文件既不必要,又费时间。文件过大,必定造成大量冗余格式代码,明显的让搜索引擎不喜欢。 |