数据中导出的excel文件:原xls文件的格式
GB2312(简体中文)
导成的数据格式:
UTF-8编码
因为python中读取xls总是出现如下错误:
nsupported
format, or corrupt
file: Expected BOF record
; found b'\xe8\xae
试了很多网上的方法但是一直出现问题,所以尝试一种新的传统方法来解决。 使用windows软件:Notepad++,打开excel文件发现数据之间的使用空格隔开的。如下所示: 但是CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。
第一步: 我们使用常规方法,在Notepad++中打开的excel文件,使用全局替换将‘空格’使用‘,’替换,完成后的文件样式如下图。 第二步: 设置文件编码格式,点击菜单栏编码->转为UTF-8编码**,然后文件另存为csv文件,即可。 我们在python中输入读取文件代码:
import pandas
as pd
data
= pd
.read_csv
('F:\\CodeDocument\\jupyter\\Test\\Bdddd.xls.csv')
data
可以看到能够正常读取文件了,虽然方法比较麻烦但是确实可以使用的。