• 欢迎 游客 您的光临,下载之前请先阅读 积分规则 。任何技术问题请在论坛提问,本站定制插件、模板主题。售前、售后问题请联系QQ:5916171
    本站自由发布资源可赚取积分及人民币(可提现)(保证资源真实可用,如被举报封号处理。谨慎分布)。
  • 即日起发表主题、回帖、发布&更新资源、创建&回复私信、发布&回复个人动态均需要验证手机号码,其它不受影响。如不便可进群提问。点击链接加入群聊【XenForo讨论社区】:群号1:143277648

教程 采集教程->内容过滤功能描述

死了算了

管理成员
UID
1
注册
2017/07/28
消息
1,721
解决方案
130
黄金
214,912G
内容过滤功能可以帮助你剔除页面上你不想要的任何数据

正文内容中包含了作者信息、广告、版权声明等这些无用信息,我们需要从正文内容中过滤掉这些内容,这些内容是变化的,每篇文章都不一样,所以是无法直接用字符串替换函数去除的,提供了非常简单的去除方式


他可以帮助我们过滤任何不想要的页面属性
  • img
  • p
  • div
  • 支持 id
  • 支持 class

还可以指定处理 第几个某某属性、


内容过滤选择器参数不光可以定义要移除的内容还可以定义要保留的内容,多个值之间用空格隔开

  • a 去除a标签保留a中文字
  • -a 去除并删除a标签
  • -img:gt(-4) 去除文章底部倒数3张图片!
  • -img:eq(1) 只过滤文章正文第2张图片 (程序从0开始)
  • -p:first 删除第一个p
  • -p 删除所有p
  • -p:last 删除最后一个p
  • ul>li>a: odd 只取奇数a
  • -.aaa 删除class等于aaa的标签
  • -#aaa 删除id等于aaa的标签
 
后退
顶部 底部