网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
06月06日漏签0天
python吧 关注:474,471贴子:1,966,929
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 27回复贴,共1页
<<返回python吧
>0< 加载中...

求教,怎么识别文件类型

  • 只看楼主
  • 收藏

  • 回复
  • zhang0ZGC
  • 探花
    11
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
有2G的网站数据,现在我想把html网页源码文件提出来,按文件名的md5保存。原本我以为只要识别后缀名就可以过滤掉图片之类的东西了,在linux下执行的,完了后,发现ubuntu能够识别这些文件!(好神奇...)还是有图片,还有js文件,这是怎么做到的


  • 一周休七日
  • 吧主
    12
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
猜的吧,有bom头的直接判断,没有的就分析特征码。就像一些好的文本阅读器都能分辨出文本的编码一样。


2025-06-06 16:49:57
广告
  • 爱玉者玉恒爱之
  • 进士
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
话说大多数的文件的头部都是一些特殊的标志。。。
详情参考linux file ~~


  • 贴吧用户_0QP2EKb
  • 状元
    14
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼


  • zixing_131
  • 榜眼
    13
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
通过文件头来认的吧、、好的文件管理器都可以这样认出来的、、


  • A_G_Lamperouge
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼


  • 七奈kiss
  • 榜眼
    13
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
读文件头


  • 守护神99
  • 进士
    9
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
谷歌搜索 文件头 去吧


2025-06-06 16:43:57
广告
  • 梦醒是自由
  • 进士
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
看看那些开源软件是怎么实现的,学习一下就会了


  • abcfy2
  • 榜眼
    13
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
linux下不靠扩展名来区分文件类型,而是靠MIME类型。
你可以试试file命令就懂了,无论扩展名是什么,file命令都会打印文件的实际类型


  • abcfy2
  • 榜眼
    13
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
对file命令感兴趣的话可以man file看一下文档,里面就阐述了file的工作原理


  • 贴吧用户_0QP2EKb
  • 状元
    14
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 27回复贴,共1页
<<返回python吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示