A5下载 - 努力做内容最丰富最安全的下载站!

A5站长下载站

当前位置:A5下载 > 源码技巧 > 父类数据 > 万能小偷程序采集规则编写教程基础篇

万能小偷程序采集规则编写教程基础篇

时间:2014-05-19 17:18作者:消息人气:215

这个小偷程序比较牛,只需要输入一个网址就能一键采集全站,且支持98%站点。但是如果要做出比较精致的采集站来还是得下点功夫。

本文就介绍一下采集规则的编写,要求程序在2.0以上版本。

首先需要选择一个目标站,目标站需要的条件:

1. 最好是单域名,即只有 www.xxx.com,最好不存在其他的二级域名,图片JS这些不影响。

2. 尽量选择JS少的站,华丽的一般JS较多,如:美丽说 这些就不合适了。

3. 图片不要防盗链,速度稳定。

教程选用的网站为:范文网,符号要求,下面开始规则的编写步骤。

一、添加规则:

1. 打开VIVI万能小偷的后台 采集节点 -> 添加 ,节点名称可以随便填写一个,然后填上目标站地址

2. 选上编码gb2312(编码的选择:在你的浏览器打开目标网站,右键查看源代码,找到text/html; charset=xxx xxx就是编码)

3. 在【目标站名称】处填:第一范文网

4. 保存

二、过滤广告:

1. 打开你的网站首页,看到已经完整的采集过来了。点击一个内页链接,进去看到有些广告

2. 回到后台,修改刚才编写的采集规则。

3. 勾选上站外链接、站外JS文件、站内JS文件 (这个站广告是放在站内JS文件所以过滤)。目的是为了过滤广告以及一些无用链接

三、替换logo

1. 对着logo图片右键,点击属性可以看到logo的地址了,把后面的地方复制下来(从问号开始)

2. 回到字符串替换规则,输入

{vivisign}siteimages/DyfwLog.gif{vivicut}{vivisign}static/fanwen/logo.gif 
(后面的 {vivisign}static/fanwen/logo.gif 代表 /static/fanwen/logo.gif,也就是把logo地址替换成你本地的logo文件)

3.到本地static文件夹下,新建一个文件夹为fanwen,然后把logo保存进去为logo.gif

教程结束,采集规则如下

VIVI:YToxNTp7czo0OiJuYW1lIjtzOjY6Ire2zsTN+CI7czo4OiJmcm9tX3VybCI7czoyNjoiaHR0cDovL3d3dy5kaXlpZmFud2VuLmNvbS8iO3M6OToib3RoZXJfdXJsIjtzOjA6IiI7czo3OiJjaGFyc2V0IjtzOjY6ImdiMjMxMiI7czoxMjoicmVwbGFjZXJ1bGVzIjtzOjE3MDoiP3NpdGVpbWFnZXMvRHlmd0xvZy5naWZ7dml2aWN1dH17dml2aXNpZ259c3RhdGljL2Zhbndlbi9sb2dvLmdpZg0Ke3ZpdmljdXRsaW5lfQ0KaHR0cDovL2ltZy5kaXlpZmFud2VuLmNvbS9zaXRlaW1hZ2VzL0R5ZndMb2cuZ2lme3ZpdmljdXR9e3ZpdmlzaWdufXN0YXRpYy9mYW53ZW4vbG9nby5naWYiO3M6OToic2lmdHJ1bGVzIjtzOjA6IiI7czo3OiJyZXBsYWNlIjtzOjE6IjAiO3M6NzoicmV3cml0ZSI7czoxOiIwIjtzOjc6ImxpY2VuY2UiO3M6NzA6IrW9c3RhdGljzsS8/rzQz8KjrNDCvajSu7j2zsS8/rzQzqpmYW53ZW6jrMi7uvOw0WxvZ2+xo7TmvfjIpc6qbG9nby5naWYiO3M6Nzoic2lmdGFncyI7YTo1OntpOjA7czo2OiJpZnJhbWUiO2k6MTtzOjY6Im9iamVjdCI7aToyO3M6NDoib3V0YSI7aTozO3M6NToib3V0anMiO2k6NDtzOjc6ImxvY2FsanMiO31zOjQ6InRpbWUiO2k6MTM5OTczMTc0NDtzOjEwOiJzZWFyY2hfdXJsIjtzOjA6IiI7czoxNDoic2VhcmNoX2NoYXJzZXQiO3M6NjoiZ2IyMzEyIjtzOjEwOiJmcm9tX3RpdGxlIjtzOjEwOiK12tK7t7bOxM34IjtzOjg6ImJpZzUyZ2JrIjtzOjE6IjAiO30=:END
标签万能,小偷,程序,采集,规则,编写,教程,基础,这个,小偷

相关下载

查看所有评论+

网友评论

网友
您的评论需要经过审核才能显示

公众号