pd.read_csv参数
时间: 2023-10-18 11:30:23 浏览: 91
Python读取csv文件数据
`pd.read_csv` 是 Pandas 库中用于读取 CSV 文件的函数,它有很多参数可以配置,比如:
- `filepath_or_buffer`:必选参数,指定文件路径或者 URL,可以是本地文件路径或者远程 URL。
- `sep`:指定字段分隔符,默认为逗号。
- `header`:指定表头所在行,默认为 0,表示第一行为表头。
- `names`:指定自定义表头的列名,如果没有表头,则需要设置 `header=None`。
- `index_col`:指定索引列。
- `usecols`:指定需要读取的列。
- `dtype`:指定每列的数据类型。
- `encoding`:指定文件编码方式,默认为 `None`,表示自动识别编码方式。
- `skiprows`:指定需要跳过的行数。
- `na_values`:指定需要将哪些值视为缺失值,可以是字符串、列表或字典。
- `parse_dates`:指定需要解析为日期时间类型的列。
- `infer_datetime_format`:是否自动推断日期时间格式。
- `dayfirst`:是否将日期的第一位解析为天,默认为 `False`。
- `chunksize`:指定每次读取的行数。
- `compression`:指定读取文件的压缩方式,可以是 `gzip`、`bz2`、`zip` 等。
- `thousands`:指定千分位分隔符。
阅读全文