Python也可以合并和拆分PDF,批量高效!

PDF是最方便的文档格式,可以在任何设备原样且无损的打开,但因为PDF不可编辑,所以很难去拆分合并。

知乎上也有人问,如何对PDF进行合并和拆分?看很多回答推荐了各种PDF编辑器或者网站,确实方法比较多。

但这种软件的弊端在于很难去批量操作,比如你有几百个PDF要合并,使用软件会非常麻烦。

而且很多软件是收费的,本来PDF合并拆分也不是什么难事,赚的是信息差的钱。

我一般会用Python的PyPDF2库来编辑PDF,其中就包括合并、拆分多个PDF。

使用Python来实现的好处是处理PDF速度快,可大批量操作,而且免费。

话不多说,下面给出案例代码:该示例代码定义了两个函数 merge_pdf() 和 split_pdf(),分别用于合并和拆分 PDF。

这两个函数使用 PyPDF2 库读取 PDF 文件,然后使用 PdfFileMerger() 类创建一个合并后的 PDF 文件,或使用 getPage() 方法获取指定页码的页面,并将其添加到合并后的 PDF 文件中。

最后,使用 write() 方法将合并后的 PDF 文件写入磁盘。

在测试代码中,首先调用 merge_pdf() 函数将两个 PDF 文件合并,然后调用 split_pdf() 函数将合并后的 PDF 文件拆分为多个页面,并将这些页面保存到不同的文件中。

这个脚本需要安装 PyPDF2 库才能使用。可以使用 pip install PyPDF2 命令安装 PyPDF2 库。

具体代码可以在公众号后台回复:pypdf,获得py文件,亲测可用


加入知识星球【我们谈论数据科学】

600+小伙伴一起学习!



相关推荐

  • 生财有术圈友,你有一份礼物待领取!
  • 招人!新智元邀你勇闯AGI之巅
  • 嗅觉数字化!AI还原记忆中的味道
  • 刚刚,李飞飞团队发布「2024年AI指数报告」!61个顶尖模型产自美国,投资暴涨8倍
  • OpenAI日本办事处成立,定制「日语版GPT-4」发布!
  • 3300万剪辑师被革命! Sora、Pika、Gen-2将全面登陆Adobe
  • 国产大模型问鼎AIGC第一股!连续2年盈利,营收10个亿
  • 危险!请马上停止使用JWT!!!
  • 一键收藏!京东零售技术近期精选文章|文末有福利
  • 今日代码大赏 | Java 实现归并排序算法
  • 离开大厂创业一年,从未受过这么大的打击!
  • 倒计时1天|在中国AIGC产业峰会,一天看尽AIGC最新趋势
  • Sora进驻Adobe视频编辑软件!新版Premiere Pro开启AI剪辑时代
  • 北大学生优化清华系大模型,拿ASC全球超算大赛冠军
  • AI换脸以假乱真!蚂蚁数科发布反DeepFake产品,还设百万奖金池邀请黑客找bug
  • 一句话打造Agent!李彦宏:人人都是开发者的时代到来
  • 价值观罗盘:如何让大模型与人类价值观对齐?
  • NAACL 2024 | 阿里提出大语言模型对齐框架Reward Learning on Policy (RLP)
  • 上海期智研究院诚聘人工智能、信息安全、量子智能及相关方向海内外顶尖人才
  • 国产开源物联网操作系统