重庆美图库!!
查看: 158|回复: 0
打印 上一主题 下一主题
收起左侧

[活动招募] 五个方面浅析搜索引擎如何处理搜索词

[复制链接]
1
跳转到指定楼层
发表于 2015-11-12 11:56 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
重庆商务网,重庆电子商务第一网!

登陆享受更多浏览权限哟~

您需要 登录 才可以下载或查看,没有帐号?入驻经典

x
搜索引擎其实也是WEB2.0的典范,因为需要处理用户输入了数据,所以能很好和用户产生交互。但对于搜索引擎而言,并不会把用户输入的所有词语都直接用于排名,而是首先会经过自己的处理,这次处理之后的词语才能直接用户排名。本文根据自己的总结和大家分享搜索引擎是如何处理我们输入的搜索词。如果不对的地方,也欢迎大家指正。
  第一、首先分词:分词是一大特色,无论我们输入的是长句子或者是短语,搜索引擎都会把这些词语进行切分,将这些搜索的字符串切分成以词为基础的关键词组合。只要这样,才能更好的通过自己已经预处理后的数据库进行查询和比对,把所有符合这些词的也没列举返回给用户。这个分词和页面分词的原理有些类似。
  第二、去停止词:我们在搜索时候带有很多的主观性,很多时候把口语话的一些词语都用在了搜索词上,但这次词往往对要搜索的内容没有实质性的帮助,但我们已经养成了输入这些词的习惯,所以搜索引擎必须要能去停止词,最大程度上保证搜索的准确率以及相关性。
  第三、指令的处理:平时我们在搜索时会输入多个词语,其实默认的情况下,搜索引擎把多个默认的词语都按照“与”来进行词语。比如你搜索“减肥”“网站”时,搜索引擎会默认我们输入的“减肥网站”来进行处理,单独包含“减肥”或者“网站”的内容理论上将不会返回,但实际情况往往也会出现单独包含一个词语的网站。另外,还要处理各种高级搜索指令的词语,比如加号减号等。
  第四、错误矫正:很多时候我们输入都会存在错误的问题,拼音本来谐音就比较多,输错也实属正常,但如果搜索引擎不进行纠错的话,就会返回很多我们不希望看到的结果。所以,有时候我们即使输入的全拼,搜索引擎也会根据这个来提示正确的中文。
  第五、分类对待:不同词语一般是不同对待的,这是搜索引擎的一个特色功能。比如我们搜索一般性的关键词,返回的一般以网页居多,而当我们搜索一个明星的名字,则会出现很多新闻、视频、图片等综合的搜索结果。所以,搜索引擎要根据用户的需求去进行判断。这次判断都是在预处理阶段进行的。
  好了,搜索引擎对于搜索词的处理基本是从这五个方面进行,在这里给大家做个总结:分词、去停止词、指令的处理、错误矫正、分类对待。虽然这个对于我们做网站没有直接的关系,但多了解一些基础知识相信会有间接的作用。网站,用户,搜索引擎本来三个就是一体的,这三个组成了整个互联网。很多道理也是想通的,知道了这些简单的知识,有可能会引发我们其它方面的一些思考和启示。由:北京戴尔  http://www.dellpc.com.cn/  收集整理nasw00e发布
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享 顶 踩
发布商机信息及企业宣传推广--请移步注册重庆商务网!!
快捷入口:给经典重庆客服留言
您需要登录后才可以回帖 登录 | 入驻经典

本版积分规则

连接招租|手机版| ( 苏ICP备13006526号-1 )

GMT+8, 2024-6-2 20:49

  • 欢迎关注重庆发展,多发帖多回帖才能持续保持帐号活力哟!请不要发表任何政 治,领 导,官 员,人 事及其它违法违规类言论,以免帐号被封禁。感谢您的支持和理解!
经典重庆旗下网站 | 24小时客服:13424176859 308675020

爱重庆,爱上经典重庆! 爱重庆,就上经典重庆!

快速回复 返回顶部 返回列表