新闻 | 财经 | 证券 | 经济 | 基金 | 能源 | 科技 | 宏观 | 房产 | 期货 | 理财 | 汽车 | 配资 | 黄金 | 法治 | 原创 | 头条
织梦采集规则以及方法/步骤

发稿时间:2018-03-29 09:16:06 来源:财经界综合

   织梦系统作为一个比较常用的文章系统,相对来说操作比较容易。在众多功能中,采集系统可能对于部分新手来说可能是比较头疼,比如采集区域设置不对、采集规则具体编辑不正确、采集后空白等问题。今天我们就从比较容易遇到的几个问题来详细讲解下。(今天主要讲的是文章类的采集,图片集的另外找个时间来讲,这个是有差异的)

工具/原料

  • 自己的网站
  • 目标的网站

方法/步骤

  1. 1

    首先我们先登录后台,分别点击 采集--采集节点管理,进入采集管理设置界面

    dedecms织梦采集规则编写教程之文章类采集
  2. 2

    这里有两个可以选择,一个是修改原先的节点(主要是之前设置错误导致采集不了或者其他设置),一个是直接新增节点,大部分以新增节点为主,点击,然后下一步,选择“普通文章”确认。

    dedecms织梦采集规则编写教程之文章类采集
  3. 3

    然后填写节点名称(建议是和栏目相关的名称,避免导入的时候出错),这个按实际填就可以了。然后第一个重点:目标页面编码   。这个是一定要填写目标网页的编码,非自己网页的。查看方法:打开目标网站随便一个页面,空白地方右键-查看源代码(编码一般在前几行)

    dedecms织梦采集规则编写教程之文章类采集
  4. 4

    然后是填写列表规则,一种是批量生成网址,一般适用于规律比较强的或者需要采集是从上到下的。比如我们是以这个栏目目标的:

    第一页列表:http://youqubu.cn/tansuo/list_5_1.html 

    第二页列表:http://youqubu.cn/tansuo/list_5_2.html。

     这个列表规则最重要的是找相同和不同点,相同点填上去,不同点用匹配符号补充,就是变量。其实这个一对比我们可以知道,http://youqubu.cn/tansuo/list_5_   .html 这里都是一样的,所以变量就是1.2.3.4.。。所以匹配的网址是:

    http://youqubu.cn/tansuo/list_5_(*).html。

    dedecms织梦采集规则编写教程之文章类采集
  5. 5

    另一种是列表规则是 手工指定列表网址,这个就比较通俗了。就是把你所有需要采集的列表页填写上去。(比较适合只采集某几页或者变量比较多的页面)

    注意:很多网站的栏目首页是以http://youqubu.cn/tansuo/这样的形式展示的,可以对比以上我们发现,少了后面的变量项。所以找到有变量项的方法是:点击这个列表的下一页,如果还弄不清楚就再点击下一页,对比列表的第二和第三页,我们可以同样发现步骤四的变量项。

  6. 共3页:
  7. 上一页
  8. 1
  9. 2
  10. 3
  11. 下一页

责任编辑:夏晨风
猜你喜欢