centos7下安装pyspark

1、安装python

2、安装jdk

3、下载spark:http://spark.apache.org/downloads.html, 下载新版(spark-2.3.1-bin-hadoop2.7.tar)

4、解压到合适的目录,我放在了/usr/lyl/spark下,采用的命令为:tar zxvf usr/lyl/spark-2.3.1-bin-hadoop2.7.tar usr/lyl/spark

5、在 /etc/profile 下配置环境变量,即加入以下:

export SPARK_HOME=/usr/lyl/spark-2.3.1-bin-hadoop2.7
export PATH=$SPARK_HOME/bin:$PATH
export PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/lib/py4j-0.10.4-src.zip:$PYTHONPATH

6、source /etc/profile

7、输入命令:pyspark,查看pyspark是否启动。如看到以下界面,即安装成功。

原文地址:https://www.cnblogs.com/Lee-yl/p/9751712.html