wordpress插件吧 关注:55贴子:123
  • 4回复贴,共1

给大家推荐一款开源采集插件

只看楼主收藏回复

#胖鼠采集# #Github开源采集插件#

介绍胖鼠:
胖鼠采集(Fat Rat Collect) 是一款能够帮助你网站自动化的工具.自动采集,自动发布,省心省力,
胖鼠采集初始化配置例子有: 微信 简书 御龙在天 寻仙 心理咨询师 虎扑 直播8,
并支持爬取任意网站列表详情页面 如(今日头条, 腾讯新闻, 简书, 知乎 …)
注: 胖鼠采集 坚持以开源学习,和大家使用最方便为宗旨!
胖鼠采集是完全内嵌到wordpress插件里面,不需要脱离wordpress,
不会安装其他任何第三方软件. 功能强大。相比其他插件. 胖鼠很有优势.
胖鼠是使用 Html,Jquery语法 爬取和剔除数据. 比其他采集器, 更灵活,
胖鼠软件的设计思想分三大块. ①爬虫模块, ②配置模块, ③数据模块
①爬虫模块主要使用配置模块的各种特色配置来爬取数据.
②配置模块为爬虫模块提供支持.
③数据模块支撑胖鼠各种特色发布功能!
安装
在wordpress插件搜索 胖鼠采集 安装即可
好处
自动任务: 可以自动采集文章, 也可以自动发布文章.
手动执行: 自动时间没到? 咱们手动来.
文章过滤: 再用不用担心爬取重复啦.
站群: 定时发布,维护站群好帮手.
导入数据: 一键导入,站群导入.
导入数据: 爬回来的数据预览, 单数据发布.
DEBUG模式: 帮你调试配置规则.
分页爬取: 爬取目标站历史文章.
手动配置采集规则采集任何网站 : 只要你只会一点点Html JQery即可写规则。如果你会一点点Html Jquery。自己搞应该没一点毛病。
例:你可以用爬虫盯着 某新闻网站的 热门新闻列表页 当出现热点事件,他们第一时间更新文章。我们自动定时爬虫就抓到了。
功能图片
上来就有几个默认的配置。大家自动导入直接用。
规则配置非常简单。作者秉承开源精神。想给大家做一款开源好用的采集工具。


IP属地:广东1楼2019-01-11 18:58回复


    IP属地:广东2楼2019-01-11 18:59
    回复
      献给有需要的同学


      IP属地:广东3楼2019-01-11 19:00
      回复
        请问能采集拼多多的商品标题+好评+商品描述吗,包括文字和图片。?


        6楼2020-04-03 18:42
        回复
          1


          IP属地:四川来自iPhone客户端7楼2022-03-26 09:08
          回复