国外代理吧 关注:126贴子:392
  • 4回复贴,共1

Oxylabs代理集成Octoparse的指南分享

只看楼主收藏回复

Octoparse是一款易于使用的数据采集工具。它允许您在无需编程的情况下抓取公共数据,并通过启用自动IP轮换和延长会话时间来绕过大多数反爬取机制。它能处理复杂的网站,并捕获各种类型的数据,包括文本、链接、图片URL和HTML代码。


IP属地:江苏1楼2023-05-16 10:03回复
    在Octoparse中配置代理设置
    1、下载、安装并打开Octoparse。 下载网址:http://www.octoparse.com/
    2、单击左上角的+New按钮,并选择Custom Task(自定义任务)创建一个新任务。

    3、在URL输入框中输入您想要从中提取数据的网页URL,然后单击Save(保存)按钮。我们以books.toscrape.com为例。

    4、在您选择的URL加载后,单击右上角的“设置”按钮。

    5、向下滚动到Anti-blocking Settings(反阻止设置)。
    6、勾选Access websites via proxies(通过代理访问网站)框。在此步骤之后,您将看到Use my own proxies(使用我自己的代理)选项和Configure(配置)按钮。

    7、单击配置按钮后,将出现一个弹出窗口。将Oxylabs的代理IP地址复制并粘贴到该字段中。Octoparse仅支持端口形式的IP。


    IP属地:江苏2楼2023-05-16 10:06
    回复
      根据不同的代理类型来配置代理设置,具体集成步骤请参考下方视频内容。
      住宅代理文档:
      developers.oxylabs.io/v/cn/dai-li/zhu-zhai-dai-li/ju-ti-guo-jia-di-qu-de-ru-kou-jie-dian
      静态数据中心代理文档:
      developers.oxylabs.io/v/cn/dai-li/zhuan-shu-shu-ju-zhong-xin-dai-li/dai-li-lie-biao
      动态数据中心代理文档:
      developers.oxylabs.io/v/cn/dai-li/gong-xiang-shu-ju-zhong-xin-dai-li/xuan-ze-guo-jia-di-qu


      IP属地:江苏3楼2023-05-16 10:07
      回复
        https://oxylabs.cn/


        IP属地:江苏4楼2023-05-16 10:08
        回复
          IP属地:江苏5楼2023-05-16 10:13
          回复