|
田锋林:搜索与人在谈搜索与人的关系之前,我们有必要学习一下搜索引擎的工作原理,大致可以分为以下三部分:
1、搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。
2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。
3、接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。
仔细想想,这个倒跟我们人类的成长与发展很相似:
1、搜索信息:
我们的学习过程也就是一个搜索信息的过程,从开始我们呱呱坠地,来到世间的那天起,我们的思想接受不同信息的熏陶,不同的信息通过不同的媒介,不同的表现形式,通过中枢神经传递给我们的大脑,当然信息的表现形式呈现多元化,包括声音,图像,视频和一些可视介质,这点倒是跟互联网现在的信息表现形式相类似,有图像,视频,网页,音频等。
2、整理信息:
这个就相当于我们的大脑存储信息,大脑存储信息并不是杂乱无章的,也是分层次,分类型和时间进行存储,我们采集来信息是杂乱无章的,只有再重新整合,归类,衔接之后,才能趋于完整和成熟,我们的大脑就是一个庞大的数据库系统,时刻存储和调用我们需要的信息资源,当需要用到该信息的时候,外界不断的凸显该信息的相关内容,在一些约束条件的制约下,大脑有规则的对所存储的信息进行筛选,将有用信息调用出来。
3、接受查询:
生活中遇到某些困难的时候,我们需要不断的在大脑数据库中寻找,东找,西凑到相关的信息,偶尔会求助他人(其他搜索引擎),查询到的信息,我们也会用一个可视化界面(SERP)表现给大家,往往对于同一个问题,我们会有多种方案罗列出来。完成这一动作的同样是我们的五官。
4、垂直搜索:
由于我们每个人的社会阅历,成长经历,知识背景,职业等的不同,我们大脑所存储的信息资源也都是不同的,所有偏重,这类似于我们现在看到的垂直搜索的概念了,也就是一些专业搜索,行业搜索。
怎样才能让搜索引擎更快速的收录?一、搜索引擎怎么不收录我的网页?
二、搜索引擎收录的很少?
三、搜索引擎收录的速度很慢?
四、网站流量很小?
这些问题一直困扰着诸位站长,尤其是一些个人网站站长,个人网站普遍存在的不利于搜索引擎的因素: |
一、网站定位不合理
大杂烩试网站,内容之间缺乏相关性,有些栏目或者版块给访客一种不知所云之感。
二、程序选择的不合理
有些程序的确是对用户很友好,但是对搜索引擎就存在很大的问题了
每个网页都是固定的标题,每个页面都很有大量图片或者Flash,页面中js比较多,URL动态问题... ...
四、营销意识不强
常见的有广告,口碑营销,电话营销,Email营销,会议营销,对于搜索引擎营销知之甚少。
五、网站推广的问题
各人站长没有资金去做竞价排名,由于以上种种缺陷决定网站的收录,流量,排名等都相对比较差,面对这些很多站长都感很无赖,更甚有的失去信心,最终放弃该站,个人站长的懂得seo(搜索引擎优化)知识的甚少。
网站的流量要提升,搜索引擎是流量来源的大户,我们不得不在搜索引擎上下功夫了,针对个人网站存在的种种问题,枫林做出一些总结:
一、向搜索引擎和一些公开目录提交
网站登录是加快网站收录的常用手段之一,故名思意,就是主动向搜索引擎提交你的站点或者网页,相当于给搜索引擎传递这样一个信号“有一个新站诞生了,赶紧收录吧!”,一般只要你的网站内容不违反该搜索引擎的相关规定(赌博,色情,宣传邪教等一些步非法信息),都会被顺利收录的,不过对于新站的收录速度是有所不同的,一般有两天的,一周的也有更长时间的,与该站点的关注程度有关,这个就需要做好新站前期的炒作工作了。
对于新站,建议去一些常用搜索免费登录入口和公开目录提交:
常用网站搜索引擎免费登录入口:http://blog.5ixb.com/seo/addurl.html
这里收藏的只是一些常用的,但是不建议每个都去提交一下,因为搜索引擎的数据之间有一个传递和参考的关于,这点枫林在前面的一篇博客中做了截图。
二、保持站点结构的简洁明晰
不要让别人进入你的站点时候感觉到不知所措,Spider相当于一个特殊的访客,只要是符合人们思维习惯的页面也就基本符合Spider的爬行。
尽量做到,导航清晰,页面中重点突出,色彩间的搭配合理,图片的大小适当,位置合理。
三、保持独特的内容
搜索引擎都喜欢独特新颖的原创内容,所以可以看到一些仅靠复制文章,修改别人文章的站点的收录情况并不是很好,有的就算收录的也很可能降低排名,对于Google来说,更多的是被放进补充材料。
四、保持经常的更新
定期更新次站点,哪怕是动几个页面也行,不要让Spider,更不要让别人觉得这个网站已经成为“孤儿”了,这样既留不住访客也留不住蜘蛛,流量从何而来?收录量从何而来?
五、不要试图为了排名去作弊
常用的作弊手法有:页面跳转,关键字堆积,隐藏关键字,垃圾链接群发,病毒式弹窗,甚至某些框架网站,总之,如果某个网页展示给用户的信息和展示给Spider的信息有很大的差异,该页面就被定义为作弊页面,同时搜索引擎也会采取相应的处理措施(降低域名的权重,降低关键字排名,严重者清除站点)
六、制作网站地图
这事一种比较古老的加快收录的手法,不过到目前为止还是适用的,网站地图,英文名称为Sitemap,一半分为XML和HTML两种格式的,而XML的网站地图是Google专门推出的一项服务,可以指导Spider更快速更准确的找到网页的路径,并做出判断是否应该收录,制作网站地图的工具也是比较多的,可以配合使用。
[blog.5ixb.com] |