网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
05月11日漏签0天
python吧 关注:473,965贴子:1,966,090
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 4回复贴,共1页
<<返回python吧
>0< 加载中...

请问可以教教我吗??

  • 只看楼主
  • 收藏

  • 回复
  • 沙之影侍者
  • 举人
    4
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
我需要 写一个 以下这样 功能的程式
输入 URL
1) 判断 这 网页 是否存在
if true(存在) 则 搜寻 这 网页 共有 多少 link
显示 每一个 link 的名字: link 的status (200 300 400)
显示 共有多少个 link
else
不正确的输入 请重新输入
2)weblink 的 status 的部份
200 判断为“活”
300 递回搜寻 最多5次(包含第5次,超过5次则 判断为 “死”)
将 新weblink名字 回传显示 并且 判断为“活”
400 判断 “死”
500 判断 “死”
3) 最后这里 我用例子说明吧 ,不然 我会 表达 不清。
/*-------------------------------------------*/
程式 web.py
URL :假设是能执行的 http冒号//www点kk点com
内有 4 个 link
1) http冒号//www点test1点com [设定为 活]
2) http冒号//www点sample点com [设定为 活]
3) http冒号//www点picture点com [设定为 死]
4) http冒号//www点google点com [设定为 活]
执行动作为
python web.py http冒号//www点kk点com
显示的结果为
1) http冒号//www点test1点com [活] 200
2) http冒号//www点sample点com [活] 200
3) http冒号//www点picture点com [死] 404
4) http冒号//www点google点com [活] 200
http冒号//www点kk点com 共有 4 个 link 存活率为 75 %
/*---------------------------------------*/


  • blackbride
  • 贡士
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
网上有一个blog(百度)写了个 在人人网上迭代搜索网页的教程
作者的注释很全,LZ可以参考一下。


2025-05-11 13:49:45
广告
  • 就是这么远
  • 探花
    10
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
没有链接吗?


  • 沙之影侍者
  • 举人
    4
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
感谢你的回覆,不过 请问 能把 链接 或是 关於“他blog的关键字” 贴一下吗??
人海茫茫 我不知道是谁耶。
谢谢~~


  • blackbride
  • 贡士
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
关键字 :python 网络爬虫
主要就是用urllib 或urllib 2 模块


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 4回复贴,共1页
<<返回python吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示