我要用易语言获取浏览器能够显示出来的页面文本,格式无所谓。
易语言里面有很网页访问命令,可以可以返回不同格式或者编码的网页源码。但是源码太多也没有用。
我想要显示的是,我通过浏览器打开这个网页后,我肉眼能够看到的文本,而不是所有所有的源文件。
有人可能会说,获取源文件之后,把源文件中的html代码全部清除,剩下的就是网页上能在浏览器中显示的文本了。
其实不是,源码中的有些代码,直接查看源码,看到的是一个标签,但是该标签通过浏览器翻译,在浏览器上显示出来的是文字或者数字。
比如百度贴吧中,每一层楼的回复,你将百度贴吧中回复的文字复制,然后在源文件中去搜索,就搜索不到。
麻烦帮忙解决这问题。非常感谢。
另外请问一下:
http读文件
http读网页
网页_访问
还有各种模块里面:
网页访问
网页访问u
彗星http读网页
等等……
这些命令,除了返回的文件格式不一样(有的返回是字节集,有的是utf8,有的是gbk等等)之外,还有其他区别吗?
易语言里面有很网页访问命令,可以可以返回不同格式或者编码的网页源码。但是源码太多也没有用。
我想要显示的是,我通过浏览器打开这个网页后,我肉眼能够看到的文本,而不是所有所有的源文件。
有人可能会说,获取源文件之后,把源文件中的html代码全部清除,剩下的就是网页上能在浏览器中显示的文本了。
其实不是,源码中的有些代码,直接查看源码,看到的是一个标签,但是该标签通过浏览器翻译,在浏览器上显示出来的是文字或者数字。
比如百度贴吧中,每一层楼的回复,你将百度贴吧中回复的文字复制,然后在源文件中去搜索,就搜索不到。
麻烦帮忙解决这问题。非常感谢。
另外请问一下:
http读文件
http读网页
网页_访问
还有各种模块里面:
网页访问
网页访问u
彗星http读网页
等等……
这些命令,除了返回的文件格式不一样(有的返回是字节集,有的是utf8,有的是gbk等等)之外,还有其他区别吗?