如何用python把pdf转成word

pdf文件和word文档是我们日常生活中经常使用的两种文件格式，我们需要将pdf文件转换为word文档，以便进行编辑和修改，那么如何使用python实现这一功能呢？我将为大家详细介绍如何用python把pdf转成word。

我们需要安装一个强大的python库——PyPDF2，PyPDF2库可以用来读取pdf文件，以及进行一系列操作，如合并、分割、旋转等，但要注意的是，PyPDF2库不能直接将pdf转换为word，我们需要借助另一个库——python-docx，下面是具体的操作步骤：

安装所需库

在命令行中输入以下命令，安装PyPDF2和python-docx库：

pip install PyPDF2
pip install python-docx

读取PDF文件

我们需要读取pdf文件，这里以一个名为"example.pdf"的文件为例：

Python

import PyPDF2
打开pdf文件
pdf_file = open('example.pdf', 'rb')
创建一个PDF文件阅读器对象
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
获取pdf文件的总页数
total_pages = pdf_reader.numPages
遍历每一页
for page_num in range(total_pages):
    # 获取当前页
    page = pdf_reader.getPage(page_num)
    # 获取当前页的内容
    page_content = page.extractText()
    # 打印内容（这里只是为了演示，实际转换不需要打印）
    print(page_content)

我们将读取到的pdf内容写入到一个新的word文档中：

Python

from docx import Document
创建一个word文档对象
doc = Document()
将每一页的内容添加到word文档中
for page_num in range(total_pages):
    page = pdf_reader.getPage(page_num)
    page_content = page.extractText()
    # 添加一个段落
    doc.add_paragraph(page_content)
保存word文档
doc.save('output.docx')