麻烦大神帮我用python表达以下scala代码

之前询问过的，也给出了回复，可是自己能力不够，有些lambda不会转译。给出修改的代码和需要翻译的代码，麻烦大神帮忙一下，非常感谢！

```class MultiSenseSkipGramEmbeddingModel
negative = opts.negative.value
window = opts.window.value
rng = random
sample = opts.sample.value.toDouble
def process(doc: String):
Int = {
sen = doc.stripLineEnd.split(' ').map(word => vocab.getId(word.toLowerCase())).filter(id => id != -1)
wordCount = sen.size

```var rightSense = 0
if (kmeans == 1)
rightSense = cbow_predict_kmeans(currWord, contexts)
else if (dpmeans == 1)
rightSense = cbow_predict_dpmeans(currWord, contexts)
else
rightSense = cbow_predict(currWord, contexts)

  contexts.foreach(context => {

  trainer.processExample(new MSCBOWSkipGramNegSamplingExample(this, currWord, rightSense, context, 1))

   (0 until negative).foreach(neg => trainer.processExample(new MSCBOWSkipGramNegSamplingExample(this, currWord, rightSense, vocab.getRandWordId, -1)))

  })
}
return wordCount

}

def cbow_predict(word : Int, contexts: Seq[Int]): Int = {
val contextsEmbedding = new DenseTensor1(D, 0)

contexts.foreach(context => contextsEmbedding.+=(global_weights(context).value))
var sense = 0
if (learnMultiVec(word)) {
var maxdot = contextsEmbedding.dot(sense_weights(word)(0).value)
for (s <- 1 until S) {
val dot = contextsEmbedding.dot(sense_weights(word)(s).value)
if (dot > maxdot) {
maxdot = dot
sense = s
}
}
}
sense
}

def cbow_predict_kmeans(word: Int, contexts: Seq[Int]): Int = {

val contextsEmbedding = new DenseTensor1(D, 0)

contexts.foreach(context => contextsEmbedding.+=(global_weights(context).value))
var sense = 0

  if (learnMultiVec(word)) {
     var minDist = Double.MaxValue
     for (s <- 0 until ncluster(word)) { 
        val mu = clusterCenter(word)(s)/(clusterCount(word)(s)) 
        val dist = 1 - TensorUtils.cosineDistance(contextsEmbedding, mu) 
        if (dist < minDist) {
          minDist = dist
          sense = s
        }
     }
  }

  clusterCenter(word)(sense).+=(contextsEmbedding)
  clusterCount(word)(sense) += 1
  sense

}

def cbow_predict_dpmeans(word: Int, contexts: Seq[Int]): Int = {
val contextsEmbedding = new DenseTensor1(D, 0)

contexts.foreach(context => contextsEmbedding.+=(global_weights(context).value))
var sense = 0

  if (learnMultiVec(word)) {
    var minDist = Double.MaxValue
    var ncluster_word = ncluster(word)
    val nC = if (ncluster_word == S) S else ncluster_word + 1
    var prob = new Array[Double](nC)
    for (s <- 0 until ncluster_word) {
      val mu = clusterCenter(word)(s) / (clusterCount(word)(s))
      val dist = 1 - TensorUtils.cosineDistance(contextsEmbedding, mu) 
      prob(s) = dist
      if (dist < minDist) {
        minDist = dist
        sense = s
      }
  }

  if (ncluster_word < S) {
    if (createClusterlambda < minDist) {
      prob(ncluster_word) = createClusterlambda
      sense = ncluster_word
      ncluster(word) = ncluster_word + 1
    }
  }
}

clusterCenter(word)(sense).+=(contextsEmbedding)
clusterCount(word)(sense) += 1
sense

}

def subSample(word: Int): Int = {
val ran = vocab.getSubSampleProb(word)
val real_ran = rng.nextInt(0xFFFF) / 0xFFFF.toDouble
return if (ran < real_ran) -1 else word
}
}

class MSCBOWSkipGramNegSamplingExample(model: MultiSenseWordEmbeddingModel, word: Int, sense : Int, context : Int, label: Int) extends Example {

def accumulateValueAndGradient(value: DoubleAccumulator, gradient: WeightsMapAccumulator): Unit = {

val wordEmbedding = model.sense_weights(word)(sense).value
val contextEmbedding = model.global_weights(context).value


val score: Double = wordEmbedding.dot(contextEmbedding)
val exp: Double = math.exp(-score) // TODO : pre-compute expTable similar to word2vec

var objective: Double = 0.0
var factor: Double = 0.0

// for POS Label
if (label == 1) {
  objective = -math.log1p(exp) // log1p -> log(1+x)
  factor = exp / (1 + exp)
}
// for NEG Label
if (label == -1) {
  objective = -score - math.log1p(exp)
  factor = -1 / (1 + exp)
}

if (value ne null) value.accumulate(objective)
if (gradient ne null) {
 gradient.accumulate(model.sense_weights(word)(sense), contextEmbedding, factor)
 // don;t update if global_weights is fixed. 
 if (model.updateGlobal == 1) gradient.accumulate(model.global_weights(context), wordEmbedding, factor)
}

}
}
比较多，麻烦了！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2020-08-29 23:07
关注
https://blog.csdn.net/u012234115/article/details/78262359?locationNum=8&fps=1

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

麻烦大家帮忙把这段scala代码转为python格式的。 python scala 自然语言处理
2020-08-28 01:43

回答 1 已采纳和 http://ask.csdn.net/questions/1095307 差不多主要是函数、lambda 的格式修改下，new util.Random，这个在 python 用 random
请帮我将这段代码转成python格式 python scala 人工智能自然语言处理
2020-08-28 01:56

回答 1 已采纳手写的，大概你参考下 ``` if sample > 0: sen = filter(lambda id : subSample(id) != -1) senLength = s
麻烦帮看下scala中两小段代码的含义 scala
2020-09-09 22:33

回答 1 已采纳 ``` @符号在scala编译中做了一个模式配置的工作,将字符串做了比对,如果值相等,将将这个值取到赋值给变量;如果值不相等,匹配不上,就报一个异常 %是除法取余数 val (d, c)
为何人工智能(AI)首选Python读完这篇文章你就知道了
2019-08-07 10:42

York1996的博客为何人工智能(AI)首选Python？读完这篇文章你就知道了。我们看谷歌的TensorFlow基本上所有的代码都是C++和Python，其他语言一般只有几千行。如果讲运行速度的部分，用C++，如果讲开发效率，用Python，谁会用Java...
请问如何把 scala 代码转化为 ast scala
2022-10-31 10:07

回答 1 已采纳 https://astexplorer.net/
Spark里一行scala代码看不懂？ scala spark
2016-02-29 07:43

回答 2 已采纳后来就懂了
一小段scala代码看不懂？ scala spark
2015-08-21 06:21

回答 1 已采纳 Array.concat 数组连接
为何人工智能 AI 首选Python 读完这篇文章你就知道了
2019-05-21 17:56

很多歌手演员的博客为何人工智能 AI 首选Python 读完这篇文章你就知道了
maven在scalaIDE下构建scala和java混合代码 scala
2017-05-09 02:26

回答 3 已采纳我最后解决了这个问题，原因是因为，我的工程里有java调用scala的代码，因此需要在编译时，设置先编译scala代码后编译java代码。方法有两个： 1，在使用mvn命令时， ``` mvn
Linux下scala解压完但是没办法配置环境变量，代码出现没有那个文件或目录 linux scala 有问必答
2022-11-19 12:59

回答 2 已采纳命令后面少了空格。vim后面是空格，然后再是文件位置。
Scala 提取字符串 scala 有问必答
2021-07-05 15:36

回答 2 已采纳这是一个json对象的数组，先将字符串变成数组，a[0]和a[1]，每一个数组元素你又可以看成是一个map集合，然后对map集合进行取值即可
取消go和python_我为什么放弃了 Python ，选择了 Go？
2021-02-05 07:56

BenL Xu的博客随着人工智能、物联网、数据科学等领域的兴起，Python 迅速升温，成为诸多开发者的首选入门语言。然而就在一片追随声中，不少开发者从 Python 转向了 Go 语言，这究竟是什么原因？接下来，来自 Stream 团队的 ...
scala在cmd中运行不出来结果 scala 有问必答
2022-03-29 14:17

回答 2 已采纳 jdk什么版本，更改为jdk1.8版本。
没有解决我的问题, 去提问

悬赏问题

¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料

麻烦大神帮我用python表达以下scala代码

2条回答 默认 最新

悬赏问题

2条回答默认最新