3 采集规则
采集规则是Pholcus最重要的组成部分之一,它采用高度灵活的结构化规则实现。
在采集规则里,你可以指定规则名、规则描述、采集网页、采集页数、采集关键词、采集内容字段等。
目前在 https://github.com/pholcus/spider_lib 由所有用户共同维护着一个公共规则库,欢迎大家贡献一份力量!
采集规则是Pholcus最重要的组成部分之一,它采用高度灵活的结构化规则实现。
在采集规则里,你可以指定规则名、规则描述、采集网页、采集页数、采集关键词、采集内容字段等。
目前在 https://github.com/pholcus/spider_lib 由所有用户共同维护着一个公共规则库,欢迎大家贡献一份力量!