使用pandas读取xlsx表格报错xlrd.biffh.XLRDError: Excel xlsx file; not supported
这个错误是因为pandas默认使用的是xlrd库去读取Excel文件,而xlrd只支持读取xls格式的Excel文件,不支持读取xlsx格式的Excel文件。为了解决这个问题,你可以通过安装openpyxl库来让pandas支持读取xlsx格式的Excel文件。安装openpyxl库的方法是在命令行中输入以下命令:
pip install openpyxl
安装完成后,你可以使用以下的代码来读取xlsx格式的Excel文件:
import pandas as pd
# 读取xlsx格式的Excel文件
df = pd.read_excel('your_file.xlsx', sheet_name='your_sheet_name')
# 获取第D列数据
d_col = df['D']
# 打印第D列数据
print(d_col)
其中,your_file.xlsx
是你要读取的Excel文件名,your_sheet_name
是你要读取的表格名。df['D']
表示获取df
这个DataFrame
对象中名为D
的列。最后,你可以使用print()
函数打印出获取到的第D列数据。
pandas读取xlsx 报错xlrd.biffh.XLRDError: Excel xlsx file; not supported
这个报错是由于在使用 Pandas 读取 Excel 文件时,没有安装 xlrd
库或者使用的 xlrd
版本不支持读取 .xlsx
格式的文件。
要解决这个问题,你可以尝试以下几个方法:
确保你已经安装了
xlrd
库。可以使用以下命令来安装最新版本的xlrd
:pip install xlrd
如果已经安装了
xlrd
,但仍然出现问题,那可能是因为xlrd
版本太旧不支持.xlsx
格式。你可以尝试升级xlrd
到最新版本:pip install --upgrade xlrd
如果以上方法都不起作用,那可能是因为 Pandas 默认使用了不支持
.xlsx
格式的读取引擎。你可以尝试使用openpyxl
作为读取引擎来读取.xlsx
文件。示例如下: ```python import pandas as pd
使用 openpyxl 作为读取引擎
data = pd.read_excel('file.xlsx', engine='openpyxl')
通过指定 `engine='openpyxl'` 参数,可以告诉 Pandas 使用 `openpyxl` 库来读取 Excel 文件。
请注意,如果你选择使用 `openpyxl` 作为读取引擎,你需要确保已经安装了 `openpyxl` 库:
```python
pip install openpyxl
通过尝试这些方法,应该能够解决你遇到的 xlrd.biffh.XLRDError
异常。
使用pandas.read_excel()报错:xlrd.biffh.XLRDError: Excel xlsx file; not supported
当你尝试使用Python的pandas库读取Excel文件时,遇到xlrd.biffh.XLRDError: Excel xlsx file; not supported
这个错误,通常是因为pandas默认使用的是xlrd库来处理.xls格式的Excel文件,而xlsx格式(也称为xlsx或.xlsx)需要使用更现代、支持XML存储格式的库,如openpyxl或pandas自身的read_excel()
函数内含的engine='openpyxl'
。
解决这个问题的方法如下:
安装必要的库:如果你还没安装openpyxl,可以使用
pip install openpyxl
命令安装。更改
read_excel
的引擎:在读取xlsx文件时,指定engine='openpyxl'
,示例如下:import pandas as pd df = pd.read_excel('your_file.xlsx', engine='openpyxl')
确保你的文件路径正确,并且文件确实是以xlsx格式存在的。如果问题仍然存在,可能是文件损坏或其他兼容性问题,检查文件是否完整,并确认文件类型确实是xlsx。
相关推荐














