网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
06月07日
漏签
0
天
python2吧
关注:
82
贴子:
199
看贴
图片
吧主推荐
游戏
5
回复贴,共
1
页
<返回python2吧
>0< 加载中...
如何使用Python来生成sitemap
只看楼主
收藏
回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
在做网站项目时,经常会使用脚本生成sitemap, 便于爬虫爬取,有利于SEO。 那么如何使用Python来生成sitemap呢?下面我们来研究一番。
安装lxml
首先需要pip install lxml安装lxml库。
如果你在ubuntu上遇到了以下错误:
送TA礼物
IP属地:湖南
1楼
2017-06-13 22:23
回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
请安装以下依赖:
sudo apt-get install libxml2-dev libxslt1-dev
IP属地:湖南
2楼
2017-06-13 22:29
回复
收起回复
2025-06-07 11:59:17
广告
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Python代码
下面是生成sitemap和sitemapindex索引的代码,可以按照需求传入需要的参数,或者增加字段:
IP属地:湖南
3楼
2017-06-13 22:30
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
效果
生成的效果应该是这种格式:
sitemap格式:
IP属地:湖南
4楼
2017-06-13 22:31
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
lastmod时间格式的问题
格式是用ISO 8601的标准,如果是linux/unix系统,可以使用以下函数获取
IP属地:湖南
5楼
2017-06-13 22:31
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
优化
一般来说,用lxml效率低并且内存占用比较大,可以直接用文件的write方法创建。
IP属地:湖南
6楼
2017-06-13 22:32
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
高考作文
2577120
2
第一批丢准考证的考生出现了
2260666
3
高考别忘了这些考试搭子
1798412
4
高考钉子户梁实第29次高考
1383183
5
范玮琪歌手2025一轮游
945150
6
为何每年高考都会下雨?
926880
7
绝区零仪玄强度如何?
824412
8
问了!黑猴时隔一年登陆Xbox
628122
9
如何评价《生化危机9》预告
626115
10
《异形:夺命舰》续集敲定
500360
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示