r 保存dataframe csv
时间: 2023-05-10 18:02:23 浏览: 123
Python批量处理csv并保存过程解析
在Python的数据分析中,面对处理的各种数据,存储和读取数据是非常关键的步骤。pandas提供了非常便利的方式,将数据存储为csv文件并读取操作,而且在处理大量数据时,使用csv是很高效的一种方法。
保存dataframe的csv方法:
DataFrame.to_csv(path_or_buf = None,sep = ',',na_rep = '',float_format = None,columns = None,header = True,index = True,index_label = None,mode =‘w',encoding = None,compression = None,quoting = None,quotechar = '"',line_terminator = None,chunksize = None,tupleize_cols = None,date_format = None,doublequote = True,escapechar = None,decimal = '.' ,errors = ‘strict',storage_options = None)
参数说明:
- path_or_buf:文件路径或者类文件对象
- sep:各个字段间的分隔符,默认为逗号
- na_rep:缺失值填充,默认为空
- float_format:指定浮点数格式化,默认为None
- columns:指定导出列的名称,以列表的形式传入
- header:是否导出列名,默认为True
- index:是否导出行索引,默认为True
- index_label:行索引的名称,默认为None
- mode:文件打开方式,默认为'w'
- encoding:编码方式,默认为utf-8
- compression:指定文件压缩格式,默认为None,可选‘infer','gzip','bz2','zip'
- quoting:引用控制,默认None
- quotechar:用于引用的字符,默认为'"'
- line_terminator:确定输出行尾的字符,默认'\n'
- chunksize:分块大小,用于逐块写入文件
- tupleize_cols:将多维列转换为元组
- date_format:日期类型输出格式
- doublequote:双引号嵌套
- escapechar:用于转义分隔符的转义字符
- decimal:指定浮点数的小数点
- errors:指定处理错误的方式
- storage_options:传递给底层存储后端的字典参数
如下为一个例子:
import pandas as pd
data = {'name': ['Tom', 'Jerry', 'Mike'],
'age': [18, 24, 30],
'gender': ['M', 'M', 'M']}
df = pd.DataFrame(data)
df.to_csv('test.csv', index=False, header=True)
注:在Windows操作系统中,路径的分割符应该为反斜杠"\",但是为了避免转义字符的影响,需要使用双反斜杠"\\"
当我们不指定参数时,默认会将索引导出并添加一列,例如:
,name,age,gender
0,Tom,18,M
1,Jerry,24,M
2,Mike,30,M
如果不想导出索引,则可以设置index=False和header=True。在实际开发中,常用方式是将自己所需的列和数据导出,如下:
df[['name', 'age']].to_csv('test.csv', index=False, header=False)
阅读全文