重庆美图库!!
查看: 105|回复: 0
打印 上一主题 下一主题
收起左侧

搜索抓取应遵守规则 违反协议将致大乱

[复制链接]
1
跳转到指定楼层
发表于 2016-1-14 22:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
重庆商务网,重庆电子商务第一网!

登陆享受更多浏览权限哟~

您需要 登录 才可以下载或查看,没有帐号?入驻经典 

x
       关于近来奇虎360归纳查找被爆出无视国际通行的Roberts协议,抓取baidu、Google等查找引擎内容,致使许多网站出于安全和隐私思考不答应查找引擎抓取的内网信息被泄露一事,资深互联网观察家洪波指出,做查找就要恪守查找职业公认的游戏规则,无视规则,任意违背规则才是真实的不正当竞争,这种行动不能从法令和zf监管上及时阻止,将引起职业大乱。
          查找引擎的原理是经过一种爬虫spider程序,主动收集互联网上的页面并获取相关信息。而鉴于网络安全与隐私的思考,每个网站都会设置自个的Robots协议,来明示查找引擎,哪些内容是情愿和答应被查找引擎录入的,哪些则不答应。而查找引擎则会按照Robots协议给与自个的权限来进行抓取。Robots协议已经成为一切查找引擎有必要恪守的国际惯例。这就比如一个正常的人去到他人家里,需要先敲门,得到许可以后才能进入客厅。
http://www.danshuisauna.com除非有主人的进一步许可和邀请,不然你不能私行进入闺阁,或许在他人家里四处遛达。
          因而,当两周前新上线的360归纳查找无视Robots协议,直接抓取未经授权的信息数据时,其做法遭到了业内人士的遍及质疑。
          据了解,baidu网站的Robots协议中并未授权360查找爬虫抓取,但是360查找无视这种设置,私行施行抓取行动。思考到许多内容源网站制止查找引擎抓取的页面中大多触及存放在服务器上的后台数据库、用户稳私、暗码等信息。这意味着,360无视内容源网站robots.txt协议中的设定,将致使存放在服务器上的不该被查找到的隐私信息被查找到,甚至直接在查找成果中展现出来。
          关于被责备违背robots协议,因为事实俱在,周鸿祎已然无法否认,但他同时反驳表明baidu在robots协议中制止360爬虫,是不正当竞争。对此洪波表明,robots协议赋予网站制止任何查找爬虫的权利,这跟不正当竞争毫无关系。360无视职业默许规则,才是真实的不正当竞争。
          “做查找就要恪守查找职业公认的游戏规则,无视规则,
惠州淡水桑拿 任意违背规则才是真实的不正当竞争。”在洪波看来,baidu并没有制止一切爬虫抓取问答、知道和贴吧的内容,baidu仅仅制止了不规则的、存在潜在安全危险的爬虫,这恰是维护市场秩序,维护用户隐私的合理行动。他指出,2008年taobao也曾制止baidu爬虫,而baidu则严格恪守robots协议,中止抓取taobao网内容,并没有以taobao不正当竞争为托言违背robots协议。

发布商机信息及企业宣传推广--请移步注册重庆商务网!!
快捷入口:给经典重庆客服留言
您需要登录后才可以回帖 登录 | 入驻经典  

本版积分规则

  • 欢迎关注重庆发展,多发帖多回帖才能持续保持帐号活力哟!请不要发表任何政 治,领 导,官 员,人 事及其它违法违规类言论,以免帐号被封禁。感谢您的支持和理解!
经典重庆旗下网站 | 24小时客服:13424176859 308675020

爱重庆,爱上经典重庆! 爱重庆,就上经典重庆!

快速回复 返回顶部 返回列表