东软帝国吧 关注:306贴子:5,539
  • 15回复贴,共1

技术贴->jsoup 应用

只看楼主收藏回复

用jsoup很方便,下个jsoup.jar就可以用了。可能需要在优化下


帖子来自:http://bbs.csdn.net/topics/390346148


IP属地:北京1楼2013-01-22 16:35回复
    官网:http://jsoup.org/


    IP属地:北京2楼2013-01-22 16:37
    回复
      开源中国提供jar下载:http://www.oschina.net/p/jsoup


      IP属地:北京3楼2013-01-22 16:37
      收起回复
        文库介绍:http://baike.baidu.com/view/4066913.htm


        IP属地:北京4楼2013-01-22 16:39
        回复
          测试代码:
          import java.io.File;
          import java.io.IOException;
          import org.jsoup.Jsoup;
          import org.jsoup.nodes.Document;
          import org.jsoup.select.Elements;
          public class Test {
          public static void main(String[] args) {
          Test t = new Test();
          t.parseUrl();
          }
          public void parseUrl() {
          try {
          Document doc = Jsoup.connect("http://www.baidu.com/").get();
          Elements hrefs = doc.select("a[href]");
          System.out.println(hrefs);
          System.out.println("------------------");
          System.out.println(hrefs.select("[href^=http]"));
          } catch (IOException e)
          {
          e.printStackTrace();
          }
          }
          }
          编译执行:
          javac -cp jsoup-1.7.1.jar:. Test.java
          java -cp jsoup-1.7.1.jar:. Test
          测试结果【截图】:


          IP属地:北京5楼2013-01-22 16:44
          回复
            IP属地:北京6楼2013-01-22 16:46
            回复
              编程在于事必躬亲!望亲身体验!


              IP属地:北京7楼2013-01-22 16:47
              回复
                API :http://jsoup.org/apidocs/


                IP属地:北京8楼2013-01-22 16:53
                回复
                  此为水贴 鉴定完毕


                  IP属地:福建10楼2013-01-25 11:54
                  收起回复
                    java网络爬虫获取一个网站上的所有链接


                    IP属地:福建11楼2013-01-31 15:45
                    回复
                      楼主这贴不错,简单实用,赞一个。。。。。。


                      IP属地:北京12楼2014-12-04 13:55
                      回复
                        干货干货干货干货干货干货干货干货


                        13楼2015-07-17 18:12
                        回复
                          会报异常 java.net.SocketTimeoutException: connect timed out


                          14楼2015-07-29 15:18
                          回复