Randomness disabled via PYTHONHASHSEED

求助
我的环境是spark2.1+hdp2.6 采用spark on yarn模式，在用pyspark时，使用了python3.5
结果在执行类似distinct 语句
user_data = sc.textFile("/testdata/u.user")
user_fields = user_data.map(lambda line: line.split("|"))
num_genders = user_fields.map(lambda fields: fields[2]).distinct().count()

报异常，如下
File "/data/opt/hadoop-2.6.0/tmp/nm-local-dir/usercache/jsdxadm/appcache/application_1494985561557_0001/container_1494985561557_0001_01_000002/pyspark.zip/pyspark/rdd.py", line 72, in portable_hash
raise Exception("Randomness of hash of string should be disabled via PYTHONHASHSEED")
Exception: Randomness of hash of string should be disabled via PYTHONHASHSEED
根据源码好像由于安全漏洞，增加了对python3控制
if sys.version >= '3.3' and 'PYTHONHASHSEED' not in os.environ:
raise Exception("Randomness of hash of string should be disabled via PYTHONHASHSEED")

我按网上方式，采用两种方法，都不行，哪位碰到，能告诉一下如何解决的吗
1、echo "export PYTHONHASHSEED=0" >> /root/.bashrc
2、spark.yarn.appMasterEnv.PYTHONHASHSEED="XXXX"

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

报告相同问题？

关注问题

将加密方法从php转换为python [关闭] php python
2018-11-08 15:20

回答 1 已采纳 Main magic here is in 2 lines: the one that you mentioned: return crypt($strPassword, '$6$' . **
关于#云计算#的问题：麒麟和openeuler系统在启动（虚拟化环境）时(操作系统-linux) linux 服务器运维
2023-01-18 11:10

回答 1 已采纳这提示，很多情况都可能造成哦，所以，我只能问一下，你是什么情况这样的？刚安装好系统重启这样？修改了/etc/fstab 重启后这样？还是？想知道你此前的状态。
这个算法是不是要套用公式啊，具体怎么计算？使用C语言，先谢谢大家哈 erlang golang r语言
2018-12-25 09:37

回答 1 已采纳 https://blog.csdn.net/KingJordon/article/details/51959336
异常：Randomness of hash of string should be disabled via PYTHONHASHSEED
2018-08-03 21:26

魔生的博客异常描述：使用Yarn-client模式提交脚本时报异常解决方案1（无效）：打印输出结果：None 解决方案2(成功)：修改spark-defaults.conf 备注： 1. 方案2适用于解决yarn-client模式下... ...
Golang中用于单元测试的种子随机数
2018-06-02 05:49

回答 2 已采纳 You should certainly not put it in the test init() function. Why? Because execution order (or even
将循环赛锦标赛1v1扩展为1v1v1v1 php
2018-08-18 11:49

回答 1 已采纳 Your foreach() with the selection of the other 3 teams is wrong. One of them have to make steps wi
Random Walking
2017-12-02 15:43

回答 1 已采纳 http://blog.csdn.net/q547550831/article/details/47375497
Spark异常Randomness of hash of string should be disabled via PYTHONHASHSEED
2020-04-02 18:50

caidongxuan的博客一、现象用java写的在spark on yarn 模式下正常。用python写的在spark on local 模式下正常，在...Exception: Randomness of hash of string should be disabled via PYTHONHASHSEED at org.apache.spark.api.p...
使用join从一个MYSQL表中选择随机行 mysql php
2017-09-14 11:06

回答 1 已采纳 you could use an inner join SELECT tracks.track_id, cuttings.square_cutting, cutt
Spark使用独立集群管理器运行任务报错（"Randomness of hash of string should be disabled via PYTHONHASHSEED"）
2019-03-09 11:10

GYT0313的博客 1 报错原因 ...19/03/09 10:58:41 WARN TaskSetManager: Lost task 1.0 in stage 3.0 (TID 8, 10.0.2.13): org.apache.spark.api.python.PythonException: Traceback (most recent call last): File ...
Python Spark 机器学习（一）
2021-02-04 15:38

他还是个孩子啊！的博客 Python Spark 机器学习（一）主要是MLlib包(基于RDD)和ml包(基于DataFrame)的使用 Python Spark MLlib 决策树二元分类通过Kaggle上一个题目来实践： StumbleUpon Evergreen Classification Challenge 该题目内容是...
pythonspark集群模式运行_Spark之运行模式
2020-12-06 12:03

weixin_39814088的博客上面执行如果出现类似这种错误：Exception: Randomness of hash of string should be disabled via PYTHONHASHSEED，请在命令中加入--conf参数： [root@hadoop-master bin]#./spark-submit --master spark://hadoop...
python库中的ssl.py
2020-03-19 19:51

qiuchangyong的博客 python要支持https传输，就要用到ssl.py文件。加密协议也从SSL版本（SSLv2、SSLv3）升级为TLS版本（TLSv1、TLSv1_1、TLSv1_2、TLSv1_3）也就是说，当前传输通道加密协议以TLS为主流。OpenSSL 1.1.1是目前最新版本，...
Matplotlib中一些函数变量的声明
2022-04-18 21:24

清水一个僧的博客目录 plt.annotate参数说明 plt.Scatter参数说明 plt.text()参数说明 plt.bar()参数说明 plt.imshow()参数说明 plot_surface()参数说明 plt.subplot2grid()参数说明 plt.annotate参数说明 ...Option..
Pytorch学习
2022-09-11 16:15

Freemanguohua的博客 pytorch学习与理解
jupyterlab使用配置
2022-01-05 18:30

eye_s1的博客文章目录一、创建jupyterlab快捷方式二、配置jupyterlab基础配置设置路径设置中文下载插件设置matplotlib风格临时修改永久修改一、创建jupyterlab快捷方式复制Jupyter Notebook的快捷方式 ...
（八）IT_开发常用单词大全
2021-01-31 10:36

军刀0923的博客开发单词单词音标注释 a collection of… 一组… a couple of… 几个 a kind of ... ...
matploltlib绘图默认参数配置文档
2020-08-27 19:46

qq_21478261的博客 linux下查看路径： >>> import matplotlib >>> matplotlib.matplotlib_fname() 'xx/anaconda3/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc' windows下路径 xx\anaconda3\anaconda3\Lib\site-...
平台搭建---spark生态版本问题
2018-01-31 09:24

diggerTT的博客 pyspark采用python3开发python版本3.5支持pyspark python3.6目前还不支持做法简单，只需要在bin/pyspark中增加export PYSPARK_PYTHON=python3再次打开bin/pyspark即配置完成pyspark采用python3. 如果想使用...
SpringBoot2.x 官方推荐缓存框架-Caffeine高性能设计剖析
2020-12-11 14:00

十指波课堂的博客概要Caffeine是一个高性能，高命中率，低内存占用，near optimal 的本地缓存，简单来说它是Guava Cache的优化加强版，有些文章把Caffeine称为“新一代的缓存”、“现代缓存之王”。本文将重点讲解Caffeine的高性能...
没有解决我的问题, 去提问

悬赏问题

¥15 用三极管设计—个共射极放大电路
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示

码龄粉丝数原力等级 --

Randomness disabled via PYTHONHASHSEED

0条回答默认最新

悬赏问题

Randomness disabled via PYTHONHASHSEED

0条回答 默认 最新

悬赏问题

0条回答默认最新