【基础】Pandas：数据读写操作（CSV, Excel, SQL）

![【基础】Pandas：数据读写操作（CSV, Excel, SQL）](https://img-blog.csdnimg.cn/20190130144438802.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5NTgyOTYw,size_16,color_FFFFFF,t_70) # 1. **2.1 CSV 文件读取** CSV（逗号分隔值）文件是一种常见的文本文件格式，用于存储表格数据。Pandas 提供了 `read_csv()` 函数来读取 CSV 文件。 ```python import pandas as pd # 读取 CSV 文件 df = pd.read_csv('data.csv') ``` **2.1.1 read_csv() 函数** `read_csv()` 函数具有以下参数： - `filepath_or_buffer`: CSV 文件的路径或文件对象。 - `sep`: 分隔符，默认为逗号。 - `header`: 指定是否将第一行作为标题行。 - `index_col`: 指定要作为索引的列。 - `skiprows`: 跳过指定行数。 - `nrows`: 读取指定行数。 - `encoding`: 文件编码。 - `dtype`: 指定列的数据类型。 # 2. 数据读取 ### 2.1 CSV 文件读取 #### 2.1.1 read_csv() 函数 `read_csv()` 函数用于从 CSV 文件中读取数据并将其转换为 Pandas DataFrame。其语法如下： ```python read_csv(filepath_or_buffer, sep=',', header='infer', index_col=None, dtype=None, engine=None, **kwargs) ``` #### 2.1.2 参数详解 | 参数 | 描述 | 默认值 | |---|---|---| | `filepath_or_buffer` | CSV 文件的路径或文件对象 | 无 | | `sep` | 分隔符，用于分隔每一行中的字段 | ',' | | `header` | 指定是否将第一行作为列名，可以是整数或字符串 | 'infer' | | `index_col` | 指定将哪一列作为索引，可以是整数或字符串 | None | | `dtype` | 指定每列的数据类型，可以是字典或字符串 | None | | `engine` | 指定用于解析 CSV 文件的引擎，可以是 'python' 或 'c' | None | **代码示例：** ```python import pandas as pd # 从 CSV 文件读取数据 df = pd.read_csv('data.csv') # 指定分隔符和列名 df = pd.read_csv('data.csv', sep=';', header=0) # 将第一列作为索引 df = pd.read_csv('data.csv', index_col=0) ``` ### 2.2 Excel 文件读取 #### 2.2.1 read_excel() 函数 `read_excel()` 函数用于从 Excel 文件中读取数据并将其转换为 Pandas DataFrame。其语法如下： ```python read_excel(io, sheet_name=0, header=0, index_col=None, usecols=None, **kwargs) ``` #### 2.2.2 参数详解 | 参数 | 描述 | 默认值 | |---|---|---| | `io` | Excel 文件的路径或文件对象 | 无 | | `sheet_name` | 指定要读取的工作表，可以是整数或字符串 | 0 | | `header` | 指定是否将第一行作为列名，可以是整数或字符串 | 0 | | `index_col` | 指定将哪一列作为索引，可以是整数或字符串 | None | | `usecols` | 指定要读取的列，可以是整数列表或字符串列表 | None | **代码示例：** ```python import pandas as pd # 从 Excel 文件读取数据 df = pd.read_excel('data.xlsx') # 指定工作表和列名 df = pd.read_excel('data.xlsx', sheet_name='Sheet1', header=1) # 将第一列作为索引并指定要读取的列 df = pd.read_excel('data.xlsx', index_col=0, usecols=[0, 1, 2]) ``` ### 2.3 SQL 数据库读取 #### 2.3.1 read_sql() 函数 `read_sql()` 函数用于从 SQL 数据库中读取数据并将其转换为 Pandas DataFrame。其语法如下： ```python read_sql(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, columns= ```

最低0.47元/天解锁专栏

送3个月

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

C知道免费提问 ( 生成式Al产品 )

相关推荐

李_涛

知名公司架构师

拥有多年在大型科技公司的工作经验，曾在多个大厂担任技术主管和架构师一职。擅长设计和开发高效稳定的后端系统，熟练掌握多种后端开发语言和框架，包括Java、Python、Spring、Django等。精通关系型数据库和NoSQL数据库的设计和优化，能够有效地处理海量数据和复杂查询。

专栏简介

欢迎来到 Python 机器学习合集，这是一个涵盖机器学习基础知识的全面指南。本专栏从 Python 基础语法开始，包括数据类型、变量、控制流语句、函数和模块。接下来，深入了解 NumPy，一个用于数组操作和运算的强大库。您将学习如何创建和操作数组，以及使用各种常用函数。通过这些基础知识，您将为探索更高级的机器学习概念做好准备，例如数据预处理、模型训练和评估。本专栏适合初学者和希望提升 Python 和机器学习技能的任何人。通过循序渐进的教程和清晰易懂的解释，您将获得在机器学习领域取得成功的必要基础。

专栏目录

最低0.47元/天解锁专栏

送3个月

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

C知道免费提问 ( 生成式Al产品 )

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

专栏目录

最低0.47元/天解锁专栏

送3个月

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

C知道免费提问 ( 生成式Al产品 )

【基础】Pandas：数据读写操作（CSV, Excel, SQL）

相关推荐

Pandas统计分析基础：读写不同数据源的数据.pptx

Pandas读写CSV文件的方法示例

python数据分析-数据表读写到pandas

pandas能否读写数据？

下列关于pandas数据读写说法正确的是

python读写数据集的具体操作

pandas文件读写方法

pandas读取sql文件

python 按列读取数据并写入txt_Python数据分析之Pandas读写外部数据文件！

python3将csv数据写入mysql_将CSV文件写入到MySQL中（用Pandas库实现MySQL数据库的读写）...

专栏目录

最新推荐

【实战演练】通过强化学习优化能源管理系统实战

【实战演练】综合案例：数据科学项目中的高等数学应用

【实战演练】深度学习在计算机视觉中的综合应用项目

【实战演练】python远程工具包paramiko使用

【实战演练】时间序列预测项目：天气预测-数据预处理、LSTM构建、模型训练与评估

【实战演练】python云数据库部署：从选择到实施

【实战演练】使用Python和Tweepy开发Twitter自动化机器人

【实战演练】使用Docker与Kubernetes进行容器化管理

【实战演练】虚拟宠物：开发一个虚拟宠物游戏，重点在于状态管理和交互设计。

【实战演练】前沿技术应用：AutoML实战与应用

专栏目录