编写独立应用程序实现数据去重
对于两个输入文件A和B,编写Spark独立应用程序,对两个文件进行合并,并剔除其中重复的内容,得到一个新文件R。
已经创建好A.txt和B.txt
下面是创建R.py的
输入python3 R.py后
对于
```scala
from spark import SparkContex
```t出现ModuleNotFoundError: No module named 'pyspark'的问题
求解
编写独立应用程序实现数据去重
对于两个输入文件A和B,编写Spark独立应用程序,对两个文件进行合并,并剔除其中重复的内容,得到一个新文件R。
已经创建好A.txt和B.txt
下面是创建R.py的
```scala
from spark import SparkContex
```t出现ModuleNotFoundError: No module named 'pyspark'的问题
求解