当前位置：

社区首页

电脑数码

电脑整机

平板电脑

电子书阅读器

文章详情

个人成长秘籍之三，每天用Python强迫自己看两页书

昨天的<文章>中提到最常用的epub电子书其实是个zip压缩文件，而且已经拿到了书名和作者名，那今天我们就直接取出书的内容。

epub文件里除了opf文件存放书的相关信息外，还有一个ncx文件存放了目录结构，它的内容类似这样

<?xml version='1.0' encoding='utf-8'?>
<ncx xmlns="/z3986/2005/ncx/" version="2005-1" xml:lang="zho">
<head>
<meta content="4" name="dtb:depth"/>
</head>
<docTitle>
<text>书名</text>
</docTitle>
<navMap>
<navPoint class="chapter" id="num_1" playOrder="1">
<navLabel>
<text>前言</text>
</navLabel>
<content src="part0001.html"/>
</navPoint>
<navPoint class="chapter" id="num_2" playOrder="2">
<navLabel>
<text>扉页</text>
</navLabel>
<content src="part0002.html"/>
</navPoint>

英文好的同学又能一眼看出它的结构了。其它的我们先不管，navMap就是导航地图的缩写，navPoint就是章节，content的src就是每页的html文件。了解这点就足够，没必要读xml和dtd等这些信息，xpath直接搞定

def extract_outline(self, f):
with self.book.open(f) as ncx:
try:
c = ncx.read().decode('utf-8')
c = c.replace('n', '').encode('utf-8')
self.outline_file = etree.HTML(c)
outlines = self.outline_file.xpath('//navpoint')
for o in outlines:
chapter = o.find('navlabel').find('text').text
if chapter:
self.outline[chapter] = o.find('content').get('src')
except Exception as e:
print(e)

lxml似乎对xml比较挑剔，用xpath拿不到结果。好在它也支持html，用小写的navpoint就可以取到所有的章节了。我们存放在一个dict里就好。下面就是遍历这个dict，在zip里找到对应的文件。但按道理来说，我们应该回到opf文件，找到对应的目录，然后去找。但最近老不出门，小编比较暴躁。反正一本书就是那些页面，我不相信有重复文件，直接遍历下文件列表，只要文件名相同，就肯定是了。

def get_page(self, page_num):
page = list(self.outline.keys())[page_num - 1]
for f in self.book.filelist:
if self.outline[page] == f.filename.split('/')[-1]:
with self.book.open(f) as p:
html = etree.HTML(p.read().decode('utf-8').replace('n', '').encode('utf-8'))
for e in html.xpath('//*'):
if e.text:
print(e.text)

page_num不应该大于目录dict()的大小，找到对应文件后，可以直接返回html，也可以象我一样用lxml转成text

回到主题，如何强迫自己看书呢。象上次我在<这篇文章>里讲的那样，建一个计划任务，每天发送两章到自己的邮箱就好了, 强迫症的你肯定不会允许未读邮件的存在吧。

展开收起

使用评测
话题：使用评测关注

+1 3 20 0

DigiHacker

111111011040494946644

17文章| 15爆料| 11粉丝

关注

相关商品推荐

iReader 掌阅 Color7 彩色墨水屏 7英寸电纸书阅读器

1689元起

看百科去购买

Hanvon 汉王 Clear 7 墨水屏电子书阅读器 4GB+64GB 灰色

1389元起

看百科去购买

Hanvon 汉王 N10touch智能办公本10.3英寸电纸书电子书阅览器

2530元起

看百科去购买

Hanvon 汉王 Clear 7英寸墨水屏电子书阅读器 32GB 灰色

1239元起

看百科去购买

BOOX 文石 Leaf3C 7英寸墨水屏电子书阅读器 4GB+64GB 黑色

1839元起

看百科去购买

iReader 掌阅 Ocean3 Turbo 7英寸墨水屏电子书阅读器 Wi-Fi 4+64GB 黑色

1569元起

看百科去购买

BOOX 文石 Leaf3 7英寸墨水屏电子书阅读器 WiFi 3GB+32GB 黑色

1452元起

看百科去购买

BOOX 文石 Tab10C 10.3英寸墨水屏电子书阅读器 Wi-Fi 4GB+128GB 蓝色

3449元起

看百科去购买

掌阅iReader Neo2 高清智能阅读本电纸书阅读器高刷智能电子书平板轻量便携

969元起

看百科去购买

BOOX 文石 Tab10C Pro 10.3英寸墨水屏电子书阅读器 Wi-Fi 6GB+128GB 蓝色

4179.05元起

看百科去购买

Hanvon 汉王 N10 10.3英寸墨水屏电子书阅读器 32GB WiFi

1849元起

看百科去购买

BOOX 文石 Poke5 6英寸墨水屏电子书阅读器 2GB+32GB 黑色

778元起

看百科去购买

Hanvon 汉王 N10 mini 2024款 7.8英寸墨水屏电子书阅读器 2GB+32GB 灰色

1899元起

看百科去购买

Xiaomi 小米电纸书 7英寸 64GB

1419元起

看百科去购买

汉王 Clear 6 6英寸电子墨水屏阅读器

669元起

看百科去购买

小猿 XY-XLJ-01 10.3英寸墨水屏电子书阅读器 4GB+64GB 银色

3799元起

看百科去购买

0评论

当前文章无评论，是时候发表评论了

提示信息

取消

确认

评论举报

垃圾广告！低俗色情！人身攻击！疑似水军评论！其他有害！

相关文章推荐

AI赋能语音转写，好看好写好轻薄的汉王N10 mini 2024

1998年Rocket eBook的出现，让电纸书走入人们的视野。随着Kindle在200... 阅读全文

+1 201 198 170
免费的电纸书才是最吼的~纪念我的口袋阅2代

这是我用的最久的电纸书了，陪伴了我四五年了~用了这么久，屏幕终于四角有些发黄了，背景光也有... 阅读全文

+1 12 20 44
无纸化阅读好物-Kindle电子书阅读器

哈喽哈喽，大家好，我是麦烧猪柳堡，很高兴和大家分享，欢迎友好交流，感谢您的阅读和支持，要天... 阅读全文

+1 15 9 29
可以放进口袋里的阅读书--文石poke5s电子书阅读器开箱+使用分享！

写在前面的话在这个快节奏的信息时代，好像安静的喝杯咖啡、看一本书都变成了一种奢侈。除了没... 阅读全文

+1 5 5 6
学习、办公的好帮手——汉王N10手写电纸本

我对电纸书情有独钟，特别是在家里的三房一厅都堆满了纸质书之后，已经没有多少空... 阅读全文

+1 3 3 5
数码3C 篇二十四：独特外观的汉王Clear 6系列墨水屏阅读器，单品测评大揭秘！

生活中不知道还有多少人依然坚持使用纸质书来阅读的，根据我的日常观察，在通勤的地铁、公交以及... 阅读全文

+1 1 1 4
如何选购电子阅读器，阅读/商务党必备刚需随身工具，汉王/科大讯飞/文石，高品质电子阅读器体验测评

这是一篇重度电子阅读器用户带来的电子阅读器选购攻略，跟着我挑电子阅读器不迷路。答主工程狗出... 阅读全文

+1 1 2 1
什么时候才能升级我的电纸书——文石boox leaf2

我买的是白色的礼盒版本，多了磁吸功能，能搭配一些更薄的保护壳，白色的颜色更不容易沾染指纹，... 阅读全文

+1 0 1 3
文石 Note X3 青春版与 Pro 版电纸书预热，即将于 4 月 23 日晚揭晓

4 月 16 日快讯，科技巨头文石正式预告，其两款新品 Note X3 青春版与 Note... 阅读全文

+1 17 12 39
文石Poke5S：小巧便携，阅读新体验！

哈喽哈喽，大家好，我是麦烧猪柳堡，很高兴和大家分享，欢迎友好交流，感谢您的阅读和支持，要天... 阅读全文

+1 6 5 4
可以放进口袋里的阅读书--文石poke5s电子书阅读器开箱+使用分享！

写在前面的话在这个快节奏的信息时代，好像安静的喝杯咖啡、看一本书都变成了一种奢侈。除了没有... 阅读全文

+1 6 3 4
文石 Poke5S阅读器简单体验！

这台文石 Poke5S阅读器是全民综测改版前我的最后一张白银必中券申请的众测产品，收到已经... 阅读全文

+1 3 1 5
低至380元！性价比最强的二手iPad，老系统更流畅！

既然咱们写平板系列，iPad岂能缺席？只不过iPad型号太乱、版本太多了，年份稍微近一点的... 阅读全文

+1 21 107 89
骁龙870平板只卖几百，还是16G大内存，结果反转了！

最近我在写二手平板系列，偶然间发现了这台华硕平板，配置是骁龙870+16G+512G，开价... 阅读全文

+1 45 48 61
安卓平板的“杂交王”，搭载魅族Flyme系统，低至220元

今天来一款超级冷门的平板，没多少人玩过，它就是JDTAB，也就是京东出的平板电脑。客观说，... 阅读全文

+1 23 70 40
香港又一城购iPad air2 及体验小记。

我又来冒泡了，昨天下午基友说既然抢不到肾6，那就搞个air 2吧，于是就开始了一段说走就走... 阅读全文

+1 14 17 95
性价比最高的华为平板，骁龙865+120Hz高刷屏，能升鸿蒙5.0

之前都是500元内的低价平板，今天开始上强度。其实我找到了一个850元的华硕平板，配置是骁... 阅读全文

+1 18 50 25
realme Pad 2 Wi-Fi 版海外版上线，搭载11.5英寸2K显示屏和 Helio G99 处理器

4 月 12 日讯，realme公司在去年7月在海外推出了 realme Pad 2 4G... 阅读全文

+1 11 10 39
曾经用来看书的kindle fire hd，目前用什么都卡

十几年前入手了这台kindle fire hd国行版本的，当时想着当电子书看，后来耐不住寂... 阅读全文

+1 20 13 20
亓纪的想法篇一千零二十八：被“忽视”的优质平板，骁龙870+10200毫安时，比红米Pad Pro还值！

当红米Pad Pro发布后，很多评论区都提到了一款更具性价比的产品，它就是被绝大部分网友“... 阅读全文

+1 5 21 16

更多精彩文章

iPad Pro 2022款128G版，玩“吃鸡”、追剧是否够用？

对于许多小伙伴来说，iPad Pro 2022款128G是否足够应对日常需求，尤其是玩游戏... 阅读全文

+1 0 0 0
什么时候才能升级我的电纸书——文石boox leaf2

我买的是白色的礼盒版本，多了磁吸功能，能搭配一些更薄的保护壳，白色的颜色更不容易沾染指纹，... 阅读全文

+1 0 1 3
文石Poke5S：小巧便携，阅读新体验！

哈喽哈喽，大家好，我是麦烧猪柳堡，很高兴和大家分享，欢迎友好交流，感谢您的阅读和支持，要天... 阅读全文

+1 6 5 4
文石 Poke5S阅读器简单体验！

这台文石 Poke5S阅读器是全民综测改版前我的最后一张白银必中券申请的众测产品，收到已经... 阅读全文

+1 3 1 5
学习、办公的好帮手——汉王N10手写电纸本

我对电纸书情有独钟，特别是在家里的三房一厅都堆满了纸质书之后，已经没有多少空... 阅读全文

+1 3 3 5
AI赋能语音转写，好看好写好轻薄的汉王N10 mini 2024

1998年Rocket eBook的出现，让电纸书走入人们的视野。随着Kindle在200... 阅读全文

+1 201 198 170
文石 Note X3 青春版与 Pro 版电纸书预热，即将于 4 月 23 日晚揭晓

4 月 16 日快讯，科技巨头文石正式预告，其两款新品 Note X3 青春版与 Note... 阅读全文

+1 17 12 39
可以放进口袋里的阅读书--文石poke5s电子书阅读器开箱+使用分享！

写在前面的话在这个快节奏的信息时代，好像安静的喝杯咖啡、看一本书都变成了一种奢侈。除了没有... 阅读全文

+1 6 3 4
数码3C 篇二十四：独特外观的汉王Clear 6系列墨水屏阅读器，单品测评大揭秘！

生活中不知道还有多少人依然坚持使用纸质书来阅读的，根据我的日常观察，在通勤的地铁、公交以及... 阅读全文

+1 1 1 4
如何选购电子阅读器，阅读/商务党必备刚需随身工具，汉王/科大讯飞/文石，高品质电子阅读器体验测评

这是一篇重度电子阅读器用户带来的电子阅读器选购攻略，跟着我挑电子阅读器不迷路。答主工程狗出... 阅读全文

+1 1 2 1
可以放进口袋里的阅读书--文石poke5s电子书阅读器开箱+使用分享！

写在前面的话在这个快节奏的信息时代，好像安静的喝杯咖啡、看一本书都变成了一种奢侈。除了没... 阅读全文

+1 5 5 6
免费的电纸书才是最吼的~纪念我的口袋阅2代

这是我用的最久的电纸书了，陪伴了我四五年了~用了这么久，屏幕终于四角有些发黄了，背景光也有... 阅读全文

+1 12 20 44
无纸化阅读好物-Kindle电子书阅读器

哈喽哈喽，大家好，我是麦烧猪柳堡，很高兴和大家分享，欢迎友好交流，感谢您的阅读和支持，要天... 阅读全文

+1 15 9 29
无纸化读书攻略-电子阅读器

哈喽哈喽，大家好，我是麦烧猪柳堡，很高兴和大家分享，欢迎友好交流，感谢您的阅读和支持，要天... 阅读全文

+1 20 11 31
一手掌握，让阅读更自如——汉王Clear 6英寸电子书阅读器轻体验

写在前面的话在数字化阅读日益普及的当下，电子书阅读器凭借其便携性、护眼功能以及海量资源等优... 阅读全文

+1 14 14 7
无以伦比的显示效果-汉王新改款N10 2024

电子书产品近几年来新品频发，更新的速度让人眼花缭乱。但是如果单纯以类纸张的显示效果而言，最... 阅读全文

+1 1 2 0
从此刻，爱上阅读——BOOX文石 Poke5S轻体验

写在前面的话曾经kindle凭借其丰富的图书资源和不错的阅读体验，稳坐电纸书行业的龙头老大... 阅读全文

+1 14 13 8
150元就能买到的电子书，kindle588，最便宜的电纸书~

之前发了几个电子书的文，有朋友问200以内能淘到什么电子书，我还真去小黄鱼找了。就是他，k... 阅读全文

+1 11 33 84
告别付费阅读时代,轻松学会搭建本地“开源阅读”平台,实现手机,电脑,Kindle跨平台畅享小说

各位小伙伴们好啊，我是你们的鼠鼠，欢迎回到鼠鼠小讲堂！今天，我们要一起探索一个非常实用的技... 阅读全文

+1 324 744 238
掌中宝藏，你的移动阅读神器

小米电子书是一款集便捷性、实用性和多功能性于一体的电子阅读器，它的优点包括以下几个方面：高... 阅读全文

+1 7 7 4