据说你们以前国创还是科研要做一个浏览器~~
不知道吧友有没有(或者知不知道)什么想法可以做一个兼容各种js的无界面java实现的浏览器内核。
现在我所知的这种东西有一个叫HtmlUnit的,但是对js的兼容性并不好。
大家想一下,要是我现在想做一个爬虫,有些牛B的页面都是用ajax异步加载的,还有一些是通过js渲染出的图表,怎样才能爬取到?
所以。。。大家有什么好的想法?
@TiMoLove
不知道吧友有没有(或者知不知道)什么想法可以做一个兼容各种js的无界面java实现的浏览器内核。
现在我所知的这种东西有一个叫HtmlUnit的,但是对js的兼容性并不好。
大家想一下,要是我现在想做一个爬虫,有些牛B的页面都是用ajax异步加载的,还有一些是通过js渲染出的图表,怎样才能爬取到?
所以。。。大家有什么好的想法?
@TiMoLove