Python将word转化为txt文本

tech2025-02-15  9

目录

1. 安装docx包2. 导入使用3.报错分析及解决方法4. 将word转化为txt文本5. docx模块的其他用法

1. 安装docx包

测试环境:Windows10,Python3.6.3 / Python3.8 命令如下:

pip3 install docx

安装成功截图:

2. 导入使用

安装完成后导入使用:

测试代码:

import docx def docx_to_txt(): # 打开文件 file = docx.opendocx("./测试文件.docx") # 读取文本内容 text = docx.getdocumenttext(file) # 打印输出到屏幕 print(type(text), text) # 调用函数 docx_to_txt()

会发现报错:

ModuleNotFoundError: No module named ‘exceptions’

3.报错分析及解决方法

报错分析:

说没有 exceptions 这个模块,由于Python3已经取消了这个模块,而 PendingDeprecationWarning 是内置 可以直接使用的,所以我们直接进入文件(根据你报错显示的路径):

然后把报错的第30行: from exceptions import PendingDeprecationWarning 注释掉,然后保存,就可以啦。

注释前:

注释后:

4. 将word转化为txt文本

再次运行测试代码,转化后得到的是一个列表格式的数据,然后根据自己的需求进行下一步处理或保存到文件。

5. docx模块的其他用法

word文档(docx)的读取和写入:docx模块

参考:https://blog.csdn.net/a649344475/article/details/81162381

最新回复(0)