使用sqoop将数据从MySQL导入hdfs的语句
时间: 2024-03-27 20:34:53 浏览: 68
导入指定列-10m光纤收发器原理图
可以使用以下 Sqoop 命令将 MySQL 中的数据导入 HDFS:
```
sqoop import \
--connect jdbc:mysql://<MySQL服务器IP地址>:<MySQL端口号>/<数据库名> \
--username <用户名> \
--password <密码> \
--table <表名> \
--target-dir <HDFS目标路径> \
--m <mapreduce任务数>
```
其中,<MySQL服务器IP地址> 是 MySQL 服务器的 IP 地址,<MySQL端口号> 是 MySQL 服务器上开放的端口号,默认为 3306;<数据库名> 是要导入数据的数据库名;<用户名> 和 <密码> 分别是 MySQL 的登录用户名和密码;<表名> 是要导入数据的表名;<HDFS目标路径> 是数据导入 HDFS 后的存储路径,需要以 HDFS URL 形式指定,如 `hdfs://<HDFS服务器IP地址>:<HDFS端口号>/<目录路径>`;<mapreduce任务数> 是指定导入数据时的 MapReduce 任务数。
例如,要将 MySQL 中的 EMP 表导入 HDFS 的 `/user/hadoop/EMP` 目录下,并使用 4 个 MapReduce 任务,可以使用以下命令:
```
sqoop import \
--connect jdbc:mysql://192.168.1.100:3306/mydb \
--username root \
--password password \
--table EMP \
--target-dir hdfs://192.168.1.101:9000/user/hadoop/EMP \
--m 4
```
执行该命令后,Sqoop 会将 EMP 表中的数据导入到 HDFS 的 `/user/hadoop/EMP` 目录下。
阅读全文