• 全部
  • 关注
  • 有问必答
  • 等你来答

排行榜

  • 用户榜
  • 标签榜
  • 冲榜分奖金

频道

  • 编程语言
  • 后端
  • Python
  • Java
  • 前端
  • 微软技术
  • 大数据
  • 运维
  • 人工智能
  • 服务器
  • 其他
  • 嵌入式
  • 开发工具
  • 数据结构与算法
  • 网络
  • 移动开发
  • 硬件开发
  • 吐槽问答
  • PHP
  • 游戏
  • 测试
  • 小程序
  • 云计算
  • 安全
  • 软件工程
  • 开放平台
  • 设计
  • 职场和发展
  • 区块链
  • 搜索
  • 多彩生活
  • HarmonyOS
  • 产品/运营
  • 设计模式
最新最热精华悬赏待回答 筛选
  • 1

    回答

while bool( 1-np.array_equal(oldCentroids,centroids) ): #新的聚类点和旧的聚类点不相等时候执行 oldCentroids = centr

qq_45976202
采纳率0%
  • 0

    回答

注意看,t值处于95%的置信区间内,但是他的p值却小于0.05.这是怎么回事?是使用双尾检测的原因还是我的理解有错误。希望朋友能够给出详细一点的说明。

回答 etzbh
采纳率100%
  • 2

    回答

使用pyspark.mllib,对几个用textFile读取的RDD(a,b,c,d)打标签 ``` A = a.map(lambda features:LabeledPoin

Eumenides-Z
采纳率100%
  • 1

在spark上使用textFile读入HDFS中的txt文件,该文件部分如下: ``` 49420 1383788 0.000020 358064278.750527 0 0.000000

  • 2

    回答

最近公司有个需求,要求要对2800万客户的地址(短中文文本),从中找出两两地址相似的客户。比如A 客户填写的地址与B客户填写的地址相似,不要求完全想等,就可以认为他们可能存在关系。最后把所有两两

qq_17260701
采纳率0%
  • 1

    回答

![文档截图](https://img-ask.csdn.net/upload/201711/10/1510304758_558230.png)。 提示要用Dataset而不是DataFrame。如何

tracyjack123
采纳率80%
  • 3

    回答

现在我使用spark mllib的逻辑回归算法计算点击率的模型快上线了。 但之后导师需要我使用决策树和因子分解机模型计算点击率预测。 我想请问这种情况下我应该怎么让这两个模型构建线上服务,并且有没有可

  • 3

    回答

据老师介绍该会涉及到spark架构、机器学习等知识,本人本科小白,目前只会基本的c++、java开发,对于这些知识了解甚少,不知从何开始学,应该看哪些书籍资料,求大神指点迷津。![图片说明](http

接骨木go
采纳率40%
  • 1

    回答

最近导师让我搭一个分布式的机器学习框架,我了解到了有Spark的MLlib和Mahout都是可以实现机器学习的算法,但在这里就想问一下,在两者之中我应该选择哪一个呢?两者之间的区别有哪些呢?谢谢大家!