【xls转成csv】常规方法进行xls到csv转换(nsupported format, or corrupt file: Expected BOF record; found b‘xe8xae)

tech2023-01-09  154

数据中导出的excel文件:原xls文件的格式

GB2312(简体中文)

导成的数据格式:

UTF-8编码

因为python中读取xls总是出现如下错误:

nsupported format, or corrupt file: Expected BOF record; found b'\xe8\xae

试了很多网上的方法但是一直出现问题,所以尝试一种新的传统方法来解决。 使用windows软件:Notepad++,打开excel文件发现数据之间的使用空格隔开的。如下所示: 但是CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。

第一步: 我们使用常规方法,在Notepad++中打开的excel文件,使用全局替换将‘空格’使用‘,’替换,完成后的文件样式如下图。 第二步: 设置文件编码格式,点击菜单栏编码->转为UTF-8编码**,然后文件另存为csv文件,即可。 我们在python中输入读取文件代码:

import pandas as pd data = pd.read_csv('F:\\CodeDocument\\jupyter\\Test\\Bdddd.xls.csv') data

可以看到能够正常读取文件了,虽然方法比较麻烦但是确实可以使用的。

最新回复(0)