网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
05月28日漏签0天
kindle吧 关注:762,256贴子:4,782,835
  • 看贴

  • 图片

  • 吧主推荐

  • 游戏

  • 1 2 下一页 尾页
  • 20回复贴,共2页
  • ,跳到 页  
<<返回kindle吧
>0< 加载中...

calibre抓取新闻攻略

  • 只看楼主
  • 收藏

  • 回复
  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
自己研究了很久终于搞懂了怎么用calibre抓取新闻!
首先,了解什么是calibre?
最简单的说,calibre是一款简单的书籍整理软件,你可以把它看成是个人的图书馆,不过,这个图书馆拥有强大的能力,能够转换书籍格式,能够抓取新闻等。。。相信很多人听说过或者使用过他,关于这部分我就不再啰嗦了,下面进入正题,如何用calibre抓取新闻。


  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼





2025-05-28 13:01:57
广告
  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
忘记说了,第一步里面是点击抓取新闻右边的小三角形


  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
下面是楼主抓取新华新闻的示范




  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
弄好之后直接点关闭,然后就可以去抓取新闻了。


  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
找到主界面的抓取新闻,这一次要点击中间(在强调一遍,刚才添加新闻源的时候是点击右边小三角形的。)


  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
接下来来说一开始没说的新闻网址的问题,现在有很多可以订阅的rss,楼主举例其中一个,如果各位看官还有好的rss订阅网址也可以告诉我。
http://www.douban.com/note/351291157/


  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
点进去网址直接复制到之前的添加那里就可以了


2025-05-28 12:55:57
广告
  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
有些杂志,博客也是可以抓取的。


  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼


还是在右下角任务任务出处看进度


  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
效果图




  • iamawarrior
  • 开卷有益
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
之所以要自己添加新闻源是因为calibre自带的下载下来只有目录。还有关于calibre还有改变封面,转换格式避免卡索引等等功能,要是有兴趣的可以回帖,楼主能力范围内知无不言。


  • 闯关东5
  • 书声琅琅
    2
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
楼主好,怎样删除每页页眉页脚的这些内容:
This article was downloaded by calibre from http://news.xinhuanet.com/politics/2016-06/01/c_129033107.htm
| 章节菜单 | 主菜单 |
????


  • feferita
  • 一介书生
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
露珠我抓取新闻老是失败啊!!!失败代码如下:
calibre, version 3.11.1 (win32, embedded-python: True)
Conversion error: 失败: Fetch news from The Economist
Fetch news from The Economist
Conversion options changed from defaults:
output_profile: 'generic_eink'
verbose: 2
Resolved conversion options
calibre version: 3.11.1
{'asciiize': False,
'author_sort': None,
'authors': None,
'base_font_size': 0,
'book_producer': None,
'change_justification': 'original',
'chapter': None,
'chapter_mark': 'pagebreak',
'comments': None,
'cover': None,
'debug_pipeline': None,
'dehyphenate': True,
'delete_blank_paragraphs': True,
'disable_font_rescaling': False,
'dont_download_recipe': False,
'dont_split_on_page_breaks': True,
'duplicate_links_in_toc': False,
'embed_all_fonts': False,
'embed_font_family': None,
'enable_heuristics': False,
'epub_flatten': False,
'epub_inline_toc': False,
'epub_toc_at_end': False,
'expand_css': False,
'extra_css': None,
'extract_to': None,
'filter_css': None,
'fix_indents': True,
'flow_size': 260,
'font_size_mapping': None,
'format_scene_breaks': True,
'html_unwrap_factor': 0.4,
'input_encoding': None,
'input_profile': <calibre.customize.profiles.InputProfile object at 0x0000019ED15B9710>,
'insert_blank_line': False,
'insert_blank_line_size': 0.5,
'insert_metadata': False,
'isbn': None,
'italicize_common_cases': True,
'keep_ligatures': False,
'language': None,
'level1_toc': None,
'level2_toc': None,
'level3_toc': None,
'line_height': 0,
'linearize_tables': False,
'lrf': False,
'margin_bottom': 5.0,
'margin_left': 5.0,
'margin_right': 5.0,
'margin_top': 5.0,
'markup_chapter_headings': True,
'max_toc_links': 50,
'minimum_line_height': 120.0,
'no_chapters_in_toc': False,
'no_default_epub_cover': False,
'no_inline_navbars': False,
'no_svg_cover': False,
'output_profile': <calibre.customize.profiles.GenericEink object at 0x0000019ED15B9A90>,
'page_breaks_before': None,
'prefer_metadata_cover': False,
'preserve_cover_aspect_ratio': False,
'pretty_print': True,
'pubdate': None,
'publisher': None,
'rating': None,
'read_metadata_from_opf': None,
'remove_fake_margins': True,
'remove_first_image': False,
'remove_paragraph_spacing': False,
'remove_paragraph_spacing_indent_size': 1.5,
'renumber_headings': True,
'replace_scene_breaks': '',
'search_replace': None,
'series': None,
'series_index': None,
'smarten_punctuation': False,
'sr1_replace': '',
'sr1_search': '',
'sr2_replace': '',
'sr2_search': '',
'sr3_replace': '',
'sr3_search': '',
'start_reading_at': None,
'subset_embedded_fonts': False,
'tags': None,
'test': False,
'timestamp': None,
'title': None,
'title_sort': None,
'toc_filter': None,
'toc_threshold': 6,
'toc_title': None,
'transform_css_rules': None,
'unsmarten_punctuation': False,
'unwrap_lines': True,
'use_auto_toc': False,
'verbose': 2}
InputFormatPlugin: Recipe Input running
Using custom recipe
Python function terminated unexpectedly
<urlopen error [Errno 10054] > (Error Code: 1)
Traceback (most recent call last):
File "site.py", line 101, in main
File "site.py", line 78, in run_entry_point
File "site-packages\calibre\utils\ipc\worker.py", line 195, in main
File "site-packages\calibre\gui2\convert\gui_conversion.py", line 26, in gui_convert
File "site-packages\calibre\ebooks\conversion\plumber.py", line 1088, in run
File "site-packages\calibre\customize\conversion.py", line 245, in __call__
File "site-packages\calibre\ebooks\conversion\plugins\recipe_input.py", line 119, in convert
File "site-packages\calibre\web\feeds\news.py", line 1023, in download
File "site-packages\calibre\web\feeds\news.py", line 1190, in build_index
File "<string>", line 154, in parse_index
File "site-packages\calibre\web\feeds\news.py", line 675, in index_to_soup
File "site-packages\mechanize\_mechanize.py", line 239, in open_novisit
File "site-packages\mechanize\_mechanize.py", line 284, in _mech_open
File "site-packages\mechanize\_opener.py", line 206, in open
File "site-packages\mechanize\_urllib2_fork.py", line 467, in http_response
File "site-packages\mechanize\_opener.py", line 224, in error
File "site-packages\mechanize\_urllib2_fork.py", line 340, in _call_chain
File "site-packages\mechanize\_urllib2_fork.py", line 586, in http_error_302
File "site-packages\mechanize\_mechanize.py", line 254, in open
File "site-packages\mechanize\_mechanize.py", line 284, in _mech_open
File "site-packages\mechanize\_opener.py", line 195, in open
File "site-packages\mechanize\_urllib2_fork.py", line 352, in _open
File "site-packages\mechanize\_urllib2_fork.py", line 340, in _call_chain
File "site-packages\mechanize\_urllib2_fork.py", line 1188, in http_open
File "site-packages\mechanize\_urllib2_fork.py", line 1160, in do_open
urllib2.URLError: <urlopen error [Errno 10054] >


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 1 2 下一页 尾页
  • 20回复贴,共2页
  • ,跳到 页  
<<返回kindle吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示