【实战演练】数据存储与分析:将爬取的数据存储到MySQL并进行数据清洗与预处理
发布时间: 2024-06-25 01:57:36 阅读量: 5 订阅数: 25 ![](https://csdnimg.cn/release/wenkucmsfe/public/img/col_vip.0fdee7e1.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/col_vip.0fdee7e1.png)
![【实战演练】数据存储与分析:将爬取的数据存储到MySQL并进行数据清洗与预处理](https://img-blog.csdnimg.cn/e17af5d71eda4c9abe0f3925ec47adfc.png)
# 2.1 MySQL数据库简介
### 2.1.1 MySQL的基本概念和术语
MySQL是一种关系型数据库管理系统(RDBMS),它存储数据并通过定义的关系来管理数据。以下是一些基本概念和术语:
- **数据库:**一个包含多个表的集合,用于存储特定主题的数据。
- **表:**一个包含多个行的集合,每个行代表一个数据记录。
- **行:**一个包含多个列的数据记录。
- **列:**一个包含特定类型数据的字段。
- **主键:**唯一标识表中每一行的列或列组合。
- **外键:**一个列,它引用另一个表中的主键,用于建立表之间的关系。
# 2. 数据存储实践
### 2.1 MySQL数据库简介
#### 2.1.1 MySQL的基本概念和术语
MySQL是一种流行的关系型数据库管理系统(RDBMS),它基于SQL(结构化查询语言)来存储和管理数据。MySQL的基本概念包括:
- **数据库:**一个数据库包含一个或多个表,用于存储相关数据。
- **表:**一个表由行和列组成,其中行表示单个数据记录,而列表示数据字段。
- **字段:**一个字段表示数据表的特定属性或特征,例如姓名、年龄或地址。
- **主键:**主键是表的唯一标识符,用于唯一标识每条记录。
- **外键:**外键是将一个表中的记录与另一个表中的记录关联起来的列。
- **索引:**索引是一种数据结构,用于快速查找表中的数据,从而提高查询性能。
#### 2.1.2 MySQL的安装和配置
**安装MySQL**
- 下载MySQL安装程序并运行它。
- 按照安装向导进行操作,选择安装路径和配置选项。
- 设置root用户密码。
**配置MySQL**
- 打开MySQL命令行界面(CLI)。
- 使用以下命令连接到MySQL:
```
mysql -u root -p
```
- 输入root用户密码。
- 使用以下命令创建数据库:
```
CREATE DATABASE my_database;
```
- 使用以下命令切换到新创建的数据库:
```
USE my_database;
```
### 2.2 数据导入与导出
#### 2.2.1 数据导入的方法和技巧
**使用命令行界面(CLI)导入数据**
```
LOAD DATA INFILE 'data.csv' INTO TABLE my_table
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n';
```
**使用MySQL Workbench导入数据**
- 右键单击要导入数据的表。
- 选择“导入数据”。
- 选择数据源文件并配置导入选项。
**优化数据导入**
- 使用批量插入语句(INSERT INTO...VALUES...)。
- 禁用外键约束(SET FOREIGN_KEY_CHECKS=0)。
- 优化数据文件格式(例如,使用CSV而不是Excel)。
#### 2.2.2 数据导出的格式和选项
**导出为CSV格式**
```
SELECT * FROM my_table INTO OUTFILE 'data.csv'
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n';
```
**导出为JSON格式**
```
SELECT * FROM my_table INTO OUTFILE 'data.json'
FORMAT JSON;
```
**导出为XML
0
0
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)