织梦(DEDECSM)后台采集规则图文教程

  • 2014-02-27
  • 来自:浩森宇特
  • 后台 采集 规则 图文 教程 DEDECSM

第一步,在菜单栏那里点击 采集-〉采集节点管理
[attachment=100249]


2.点击采集节点管理进入到管理界面,点击添加添加新节点



3.点击添加添加新节点-〉普通文章 -〉确定-进入的界面 看图



4.进入到界面就开始写

(1)节点名称: 这里就随便写好,为了好分,最好写采集的站点,
     我里就写上那个站点的名称:画堂韶光艳 
区域匹配模式: 这里默认
目标页面编码:这里看你要采集站点的的页面编码,查看源码就看到



这里是gb2312目标页面编码:选上GB2312 
(1)引用网址:这里写上你要采集的那个站点的URL:http://www.soxs.cn/
(2)匹配网址:这里就要看你的采集的站点是怎 样的了 据根站点的特点,我这里还是写上站点的域名
(3)区域开始的HTML 这里是你要采集文章的URL的一个区块 这里写上的HTML是唯一的文档
这里我写上<ul>结束我就写好 </ul>刚好对应
(5) 对区域网址进行再次筛选 这里可以排除自己不想采集的url这里就不写了,
(6) 在这个页没有说点的其他地方就默认就行了





5.写好这些就保存信息并进入下一步设置(看效果图)



6.再点下一步设置



7文章标题 规则 这里查看源代码 把文章的标题的代码写进来



8.文章内容 规则<script language="javascript">GetFont();</script>[内容]<div id="thumb">
这里我就这样写上,这里也是根据目标站点写的,你们自己去看吧



9.过滤规则: 这里点 常用规则

图片:图片12.png



在线客服
免费咨询热线

010-89294966

13240313971