pandas.read_csv参数
时间: 2023-06-01 20:03:07 浏览: 123
1. filepath_or_buffer:文件路径(字符串),URL或文件型对象(例如StringIO)。
2. sep:分隔符,默认为逗号。可以是任何字符串,如“\t”、“|”等。
3. delimiter:可选参数,与sep相同,但是只能是单个字符。
4. header:用作列名的行数。默认值为0(第一行),如果没有列名则应将其设置为None。
5. names:列名列表,用于替换header。如果header=None,则必须指定names。
6. index_col:将列号或列名用作行索引。如果不是整数或整数列表,则返回多层索引。
7. usecols:要读取的列的列表。如果不指定,则读取所有列。
8. dtype:每列的数据类型。可以是Python类型或NumPy dtype。
9. skiprows:需要跳过的行数(从0开始)。可以是单个整数或整数列表。
10. skipfooter:需要跳过的行数(从文件末尾开始)。默认为0。
11. na_values:用于识别缺失值的值列表。默认情况下,以下值将被视为缺失值:“”,“#N / A”,“#N / A N / A”,“#NA”,“-1.#IND”,“-1.#QNAN”,“-NaN”,“-nan”,“1.#IND”,“1.#QNAN”,“N / A”,“NA”,“NULL”,“NaN”,“n / a”,“nan”,“null”。
12. parse_dates:将列中的值解析为日期时间。如果是True,则尝试解析所有列。如果是列表,则仅尝试解析在其中列中的列编号或列名。
13. date_parser:用于解析日期时间的函数。默认情况下使用dateutil.parser.parse。
14. nrows:要读取的行数。如果文件包含更多行,则将忽略其余行。
15. skip_blank_lines:如果为True,则跳过空行。默认为True。
16. comment:注释字符。如果指定,则将从该字符开始的所有文本视为注释并跳过。
17. encoding:文件的编码类型。默认为None,将使用系统默认编码。
18. squeeze:如果数据只包含一列,则返回Series。如果为False,则始终返回DataFrame。
19. thousands:千分位分隔符。
20. decimal:十进制分隔符。
阅读全文