首页pandas2.0 pd.read_csv参数

pandas2.0 pd.read_csv参数

时间: 2023-11-24 13:50:28 浏览: 180

pandas2.0中的pd.read_csv()函数有许多参数可以使用，以下是其中一些常用的参数：

filepath_or_buffer：文件路径或URL。默认情况下，它期望逗号分隔值（CSV）文件。
sep：指定分隔符，默认为逗号。
header：指定哪一行作为列名，默认为0，即第一行。
index_col：指定哪一列作为行索引，默认为None。
usecols：指定要读取的列，默认为None，即读取所有列。
dtype：指定每列的数据类型，默认为None，即自动推断数据类型。
na_values：指定哪些值应该被视为缺失值，默认为None。
skiprows：指定要跳过的行数，默认为None。
nrows：指定要读取的行数，默认为None，即读取所有行。
on_bad_lines：指定如何处理无效行，默认为'error'，即抛出异常。可以设置为'skip'，表示跳过无效行。

以下是一个示例，演示如何使用pd.read_csv()函数读取CSV文件并指定一些参数：

import pandas as pd

# 读取CSV文件，并指定分隔符为制表符，第一行为列名，第一列为行索引
df = pd.read_csv('data.csv', sep='\t', header=0, index_col=0)

# 读取CSV文件的前10行
df = pd.read_csv('data.csv', nrows=10)

# 读取CSV文件，将'NA'和'N/A'视为缺失值
df = pd.read_csv('data.csv', na_values=['NA', 'N/A'])

# 读取CSV文件，跳过前5行和无效行
df = pd.read_csv('data.csv', skiprows=5, on_bad_lines='skip')