spark-submit --master yarn predict.py
时间: 2024-01-15 10:04:48 浏览: 175
这是一个提交 Spark 应用程序的命令,其中包括以下参数:
- `--master yarn`:指定 Spark 应用程序的主节点为 YARN(Hadoop的资源管理器)。
- `predict.py`:要提交的 Python 脚本文件名。
该命令将启动一个 Spark 应用程序,该应用程序将执行 `predict.py` 中的代码。具体而言,该应用程序将在 YARN 上启动 Spark 集群,并将 `predict.py` 分发到该集群中的每个节点上运行。这样,该应用程序可以利用集群中的所有计算资源来处理数据。
相关问题
/export/server/spark/spark-3.2.3-bin-hadoop2.7/bin/spark-submit --master yarn predict.py")
这是一个命令行代码,用于提交一个 PySpark 应用程序到 YARN 集群上运行。其中,`/export/server/spark/spark-3.2.3-bin-hadoop2.7/bin/spark-submit` 是 PySpark 提交脚本的路径,`--master yarn` 表示使用 YARN 作为集群管理器,`predict.py` 是要提交的 PySpark 应用程序的文件名。通过这个命令,你可以将自己的 PySpark 应用程序提交到 YARN 集群上运行。
spark-submit --class org.apache.spark.examples.SparkPi --master yarn examples/jars/spark-examples_2.12-3.0.2.jar 10
这是一个使用 Spark 提交作业的命令,其中:
--class org.apache.spark.examples.SparkPi :指定要运行的主类
--master yarn :指定运行模式为 Yarn
examples/jars/spark-examples_2.12-3.0.2.jar :要运行的 jar 包路径
10 :SparkPi 运行时传递的参数,这里指定为 10。具体来说,SparkPi 是一个计算 Pi 值的示例程序,这个参数表示要计算的分区数。
阅读全文