java吧 关注:1,241,600贴子:12,715,114

第三天了。抓取网页图片还是无果。

只看楼主收藏回复

好多办法都试了。
想下载我要下载的某个网页的验证码实现自动登录。
但是就是下载不下来。它这个验证码地址是随机的。
识别部分已经OK了。没什么问题。就是这个下载网页上的验证码这么难。
我想下载我当前网页的验证码。必须要一致。
实在无招了。。。求大家帮个忙好吗。。。。


IP属地:湖南1楼2014-08-21 17:31回复
    快来人给个方向把。我快屎了、、、


    IP属地:湖南2楼2014-08-21 17:34
    回复


      IP属地:湖南3楼2014-08-21 17:34
      回复


        IP属地:湖南4楼2014-08-21 17:38
        回复
          还是一样 一个人都没有、、、


          IP属地:湖南5楼2014-08-21 17:39
          回复
            ~放弃来这问这个了


            IP属地:湖南6楼2014-08-21 17:50
            回复
              可以看下验证码的JS


              IP属地:浙江7楼2014-08-21 18:29
              收起回复
                你这是写自动打码程序么


                来自Android客户端8楼2014-08-21 18:55
                收起回复
                  楼主识别部分怎么做的?求指教!!


                  IP属地:河南来自Android客户端9楼2014-08-21 18:58
                  收起回复
                    把识别的代码发来我研究研究,说不定能找到方法,另外说下验证码的图片都是实时在内存中生成的,服务器里根本就不存在那些图片,所以没办法下载


                    来自手机贴吧11楼2014-08-21 22:58
                    收起回复
                      获取验证码url和实现模拟登录操作都可以使用httpclient把整个响应的document下载回来用httpcleaner解析到验证码的位置,把url取出然后再下载


                      IP属地:广东来自Android客户端12楼2014-08-21 23:01
                      收起回复
                        既然你已经收到验证码了,就说明你已经被反作弊机制识别出来了。你现在纠结如何自动输入验证码还是非常有难度的,而且服务端随便一个升级,你又识别不了了。我觉得你应该把精力放在如何伪装自己的抓取策略,不被反作弊系统发现。在抓取请求中模拟一些用户点击查询发过去,并且设置ip和cookie池,每隔一段时间就换,可以减少被拉黑的概率


                        IP属地:北京来自Android客户端13楼2014-08-21 23:29
                        收起回复
                          用HttpWatch看看吧。


                          IP属地:重庆14楼2014-08-21 23:39
                          收起回复