pandas2.0 pd.read_csv参数
时间: 2023-11-24 13:50:28 浏览: 180
pandas2.0中的pd.read_csv()
函数有许多参数可以使用,以下是其中一些常用的参数:
filepath_or_buffer
:文件路径或URL。默认情况下,它期望逗号分隔值(CSV)文件。sep
:指定分隔符,默认为逗号。header
:指定哪一行作为列名,默认为0,即第一行。index_col
:指定哪一列作为行索引,默认为None。usecols
:指定要读取的列,默认为None,即读取所有列。dtype
:指定每列的数据类型,默认为None,即自动推断数据类型。na_values
:指定哪些值应该被视为缺失值,默认为None。skiprows
:指定要跳过的行数,默认为None。nrows
:指定要读取的行数,默认为None,即读取所有行。on_bad_lines
:指定如何处理无效行,默认为'error',即抛出异常。可以设置为'skip',表示跳过无效行。
以下是一个示例,演示如何使用pd.read_csv()
函数读取CSV文件并指定一些参数:
import pandas as pd
# 读取CSV文件,并指定分隔符为制表符,第一行为列名,第一列为行索引
df = pd.read_csv('data.csv', sep='\t', header=0, index_col=0)
# 读取CSV文件的前10行
df = pd.read_csv('data.csv', nrows=10)
# 读取CSV文件,将'NA'和'N/A'视为缺失值
df = pd.read_csv('data.csv', na_values=['NA', 'N/A'])
# 读取CSV文件,跳过前5行和无效行
df = pd.read_csv('data.csv', skiprows=5, on_bad_lines='skip')
相关推荐
















