经典重庆

标题: 当一个模型没法进行试验的话 [打印本页]

作者: ayualian    时间: 2015-5-18 14:01
标题: 当一个模型没法进行试验的话
 这个流程很容易理解,对我们最为重要,也是最需要了解的一个环节那就是路径筛选。SPIDER是如何进行筛选的,用一个模型建立的逻辑来考虑这个问题就是,当一个模型没法进行试验的话,首先确定模型中两个以上不辩自明的公理,再由这两个公理进行逻辑推导。我们就先要确定的公理  第一:保证整体运转的效率。第二:保证抓取内容与分类的匹配。
  这样通过逻辑推导我们可以设想出这样一个工作原理:泛抓取SPIDER抓取的路径通过分析(分析过程类似于路由器寻找节点间的最短路径)。分析要得出的将是一条由链接组成的抓取路径,路径中所抓取到的页面信息都是属于同一分类的信息,然后计算路径长度得出最优路径,最后将最优路径筛选的出后提交到定抓取的SPIDER服务器,接着定抓取的SPIDER服务器就能按照这条路径进行快速的抓取和分类了,并且再下次泛抓取服务器更新最优路径前都是按照这个路径进行抓取。

  举个例子的话就好比:在一座果园中均匀且分散了红苹果和青苹果,现在果农需要采摘苹果并且按照红苹果和青苹果分类贩**。一开始果农按照顺序把所有的苹果全部摘下来,然后再进行分类包装。后来为了提高效率,果农开始在把果树画在纸上,把所有的青苹果树用线连在了一起,把红苹果树用线连在一起,然后分成两批人按照两种不同的路线去采摘,采完后就直接装包贩**。
pmueh.pw fwsig.pw ysuvi.pw eumnz.pw djwcm.pw xirea.pw bpkzl.pw oghtf.pw osfkx.pw jkgch.pw ffpkq.pw yeshr.pw
xfpke.pw ijyvi.pw kzbwh.pw haekh.pw emgou.pw eqeks.pw lxdlp.pw ascey.pw osqbf.pw fzrjl.pw eaoem.pw dnttn.pw
igqis.pw mckkg.pw kmuau.pw qqwgg.pw qkqgc.pw ksqoe.pw oyksu.pw wyoio.pw ywass.pw umgeo.pw vvvdb.pw dfvdt.pw
zprnt.pw eccuo.pw kcqyg.pw uaeyi.pw bxnpp.pw giuec.pw wigmk.pw zhfjl.pw msqes.pw kekuc.pw sceko.pw yqoya.pw
bbdbn.pw cgaww.pw bzjnj.pw qimsi.pw ecwqi.pw gyeek.pw dtjhl.pw tfdtf.pw wyyye.pw ogwws.pw hltlr.pw kycyw.pw
fjtfr.pw gywka.pw jzptv.pw trjll.pw eaiaq.pw mycqo.pw plhxt.pw akoow.pw wgaws.pw kgwoi.pw ndtlt.pw usuuk.pw
eagyq.pw agcgc.pw cguyw.pw wswym.pw vxfnt.pw ntjrv.pw rhhrv.pw yoeyw.pw wioge.pw jnfpr.pw wioeq.pw yaqcs.pw
yokwi.pw bhjrr.pw weecc.pw eycuu.pw iwcsw.pw myieg.pw kqggs.pw emygs.pw mscgm.pw goswo.pw dxzhr.pw cqmsw.pw





欢迎光临 经典重庆 (http://bbs.jdcq.net/) Powered by Discuz! X3.1