pandas readexcel参数说明
时间: 2023-10-21 09:37:03 浏览: 51
好的,关于pandas的read_excel函数,它的常用参数如下:filepath_or_buffer(文件路径或类文件对象)、sheet_name(指定读取的sheet名字或序号)、header(指定列名所在的行数,默认0,表示第一行)、index_col(指定读取的列作为行索引)、usecols(指定读取的列)、skiprows(跳过的行数)、nrows(读取的行数)等等。如果还有其他问题,请继续提问。
相关问题
pandas read_excel参数
Pandas中read_excel函数的常用参数有:
- filepath_or_buffer: excel文件路径或文件名
- sheet_name: 要读取的excel sheet的名称或编号(默认读取第一个sheet)
- header: 行号作为列名(默认为0)
- skiprows: 跳过前几行(默认为0)
- skipfooter: 跳过最后几行(默认为0)
- index_col: 使用哪一列作为索引(默认为None)
- names: 给列赋予新的名称(默认为None)
- usecols: 使用哪些列(默认读取所有列)
- engine: 使用的读取引擎(默认为'openpyxl', 可选'xlrd'或'xlwt')
- converters: 转换某些特殊列的数据类型(默认为None)
- true_values: 将特定值解释为True(默认为None)
- false_values: 将特定值解释为False(默认为None)
- na_values: 将特定值解释为NA/NaN(默认为None)
- keep_default_na: 是否保留默认的NA/NaN值(默认为True)
- verbose: 显示读取进度(默认为False)
- parse_dates: 将哪些列解释为日期(默认为None)
- date_parser: 日期解析函数(默认为None)
- dayfirst: 是否默认将日期按照'DD/MM/YYYY'的格式解析(默认为False)
- iterator: 是否使用迭代器读取文件(默认为False)
- chunksize: 迭代器读取的块大小(默认为None)
- compression: 压缩类型(默认为None, 可选'infer', 'gzip', 'bz2', 'zip', 'xz'等)
- thousands: 千位分隔符(默认为None)
- decimal: 小数点符号(默认为'.')
- linetermin: 行结束符(默认为'\r\n')
- quotechar: 引用符(默认为'"')
- quoting: 引用模式(默认为csv.QUOTE_MINIMAL, 可选csv.QUOTE_ALL, csv.QUOTE_NONNUMERIC, csv.QUOTE_NONE)
- doublequote: 是否将引用符内的引用符转义(默认为True)
- escapechar: 转义符(默认为None)
- comment: 注释符(默认为None)
- encoding: 编码方式(默认为None, 可选'utf-8', 'cp1252'等)
- dialect: 对话方式(默认为None, 可选csv.excel, csv.excel_tab等)
- tupleize_cols: 是否将列转换为元组(默认为False)
- error_bad_lines: 是否忽略读取过程中出现的错误(默认为True)
- warn_bad_lines: 是否在出现错误时发出警告(默认为True)
- skip_blank_lines: 是否跳过空行(默认为True)
- keep_date_col: 是否保留原有的日期列(默认为True)
- dayname: 是否包含星期名称(默认为False)
- thousands: 千位分隔符(默认为',')
- keep_default_na: 是否保留默认的NA/NaN值(默认为True)
- na_filter: 是否过滤NA/NaN值(默认为True)
- memory_map: 是否使用内pandas的read_excel()函数有许多可选参数。
常用参数如下:
- `io`: 文件路径或者文件类型。
- `sheet_name`: 读取的工作表名称或编号。
- `header`: 用来作为列名的行号。
- `skiprows`: 跳过的行数。
- `index_col`: 作为索引的列编号。
- `usecols`: 选择读取的列。
- `nrows`: 读取的行数。
其他参数可以参考官方文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html
pandas.read_excel参数
1. io:要读取的Excel文件的路径或URL或文件类型对象,默认为None。
2. sheet_name:要读取的工作表的名称或索引,如果为None,则默认读取第一个工作表,默认为None。
3. header:作为列名的行号,默认为0(第一行),如果没有列名,则设置为None。
4. names:自定义列名,如果header=None,则必须指定列名。
5. index_col:用作行索引的列号或列名,默认为None,表示不设置行索引。
6. usecols:要读取的列号或列名的列表,默认读取所有列。
7. dtype:指定每列的数据类型,可以是字典或者函数,默认为None。
8. skiprows:要跳过的行数,从文件的开始位置计数,默认为0,表示不跳过任何行。
9. nrows:要读取的行数,默认为None,表示读取所有行。
10. skipfooter:要跳过的行数,从文件的末尾计数,默认为0,表示不跳过任何行。
11. na_values:用于替换NaN值的值的列表,默认为None。
12. engine:使用哪种解析引擎,可以是'openpyxl'、'xlrd'、'xlsxwriter'、'pyxlsb',默认为'xlrd'。
13. convert_float:将浮点数的Excel列转换为整数,以避免Excel浮点数精度问题,默认为True。
14. verbose:打印读取过程中的详细信息,默认为False。
15. squeeze:如果只有一列,则返回一个Series而不是DataFrame,默认为False。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)