spark-example

Spark应用开发示例代码

环境搭建

Hadoop：CentOS7 部署 Hadoop 3.2.1 (伪分布式)
Spark：CentOS7 安装 Spark3.0.0-preview2-bin-hadoop3.2

分词统计

#新建输入输出目录
hdfs dfs -mkdir /input
hdfs dfs -mkdir /output
hdfs dfs -mkdir /spark
hdfs dfs -mkdir /spark/history

#上传测试文件
hdfs dfs -put ~/data/server/hadoop/3.2.1/LICENSE.txt /input/test.txt

# 命令的最后三个参数，是java的main方法的入参，具体的使用请参照WordCount类的源码
/data/server/spark/3.0.0-preview2-bin-hadoop3.2/bin/spark-submit \
--master spark://172.16.1.126:7077 \
--class com.phpragon.spark.WordCount \
--executor-memory 512m \
--total-executor-cores 2 \
./spark-example-1.0-SNAPSHOT.jar \
172.16.1.126 \
9000 \
test.txt

读取hdfs上的文件并输出

vi person.txt

1,zhangsan,20
2,lisi,29
3,wangwu,25
4,zhaoliu,30
5,tianqi,35
6,kobe,40

#上传测试文件
hdfs dfs -put ./person.txt /test/person.txt

# 命令的最后三个参数，是java的main方法的入参，具体的使用请参照WordCount类的源码
/data/server/spark/3.0.0-preview2-bin-hadoop3.2/bin/spark-submit \
--master spark://172.16.1.126:7077 \
--class com.phpragon.spark.ReadHdfsFile \
--executor-memory 512m \
--total-executor-cores 2 \
./spark-example-1.0-SNAPSHOT.jar

读取hdfs上的文件并写入到MySql

#上传测试文件
hdfs dfs -put ./person.txt /test/person.txt

# 命令的最后三个参数，是java的main方法的入参，具体的使用请参照WordCount类的源码
/data/server/spark/3.0.0-preview2-bin-hadoop3.2/bin/spark-submit \
--master spark://172.16.1.126:7077 \
--class com.phpragon.spark.ReadHdfsFileWriteToMySql \
--executor-memory 512m \
--total-executor-cores 2 \
./spark-example-1.0-SNAPSHOT.jar

读取MySql并写入到hdfs文件

#上传测试文件
hdfs dfs -put ./person.txt /test/person.txt

# 命令的最后三个参数，是java的main方法的入参，具体的使用请参照WordCount类的源码
/data/server/spark/3.0.0-preview2-bin-hadoop3.2/bin/spark-submit \
--master spark://172.16.1.126:7077 \
--class com.phpragon.spark.ReadMySqlDataWriteToHdfsFile \
--executor-memory 512m \
--total-executor-cores 2 \
./spark-example-1.0-SNAPSHOT.jar

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
src/main		src/main
test		test
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

spark-example

环境搭建

分词统计

读取hdfs上的文件并输出

读取hdfs上的文件并写入到MySql

读取MySql并写入到hdfs文件

About

Releases

Packages

Languages

License

phpdragon/spark-example

Folders and files

Latest commit

History

Repository files navigation

spark-example

环境搭建

分词统计

读取hdfs上的文件并输出

读取hdfs上的文件并写入到MySql

读取MySql并写入到hdfs文件

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages