java吧 关注:1,240,638贴子:12,712,175
  • 4回复贴,共1

python做抓取服务器的问题

只看楼主收藏回复

问大家一个问题:python做抓取服务器的问题
最近公司接到一个项目是做移动办公的项目主要是电子审批系统的客户端,但是别人做不了所以我们公司接下来了,现在项目已经做好了,交付使用了
项目碰到一个问题,主要是把别人web页面抓取下来,存到自己的数据库里面然后推送到到android上然后android上进行审批,
抓取的模块我们老大已经做好了,但是用java太费劲了,而且下次不可以重用,他提议让我们回去自己实现一个抓取的模块,要可以重用的,回去研究下,
请问pyhon有谁做的啊,有没有什么框架或者什么开源的模块啊,
希望多多讨论


IP属地:上海1楼2013-03-30 14:15回复
    java很费劲么,我怎么觉得java挺好的。什么叫不可以重用


    IP属地:上海2楼2013-03-30 14:24
    收起回复
      楼主可以试一下用jsoup这个java类库来抓页面


      IP属地:山东4楼2013-03-30 14:52
      收起回复