ＨＭＭ词性标注提示ＨＭＭ没有定义

问题遇到的现象和发生背景

ＨＭＭ怎么会没有定义

问题相关代码，请勿粘贴截图

class HMM(object):
def init(self):
pass

def try_load_model(self,trained):
    pass

def train(self,path):
    pass

def viterbi(self,text,states,start_p,trans_p,emit_p):
    pass

def cut(self,text):
    pass

def __int__(self):
    import os

    self.model_file = './data/hmm_model.pkl'

    self.state_list = ['B','M','E','S']

    self.load_para = False

def try_load_model(self,trained):
    if trained:
        import pickle
        with open(self.model_file,'rb') as f:
            self.A_dic = pickle.load(f)
            self.B_dic = pickle.load(f)
            self.Pi_dic = pickle.load(f)
            self.load_para = True
    else:
        self.A_dic = {}
        self.B_dic = {}
        self.Pi_dic = {}
        self.load_para = False

def train(self,path):

    self.try_load_model(False)

    Count_dic = {}

    def init_parameters():
        for state in self.state_list:
            self.A_dic[state] = {s:0.0 for s in self.state_list}
            self.Pi_dic[state] = 0.0
            self.B_dic[state] = {}

            Count_dic[state] = 0

    def makeLabel(text):
        out_text = []
        if len(text) == 1:
            out_text.append('S')
        else:
            out_text += ['B'] + ['M'] * (len(text) -2) + ['E']
        return out_text

    init_parameters()
    line_num = -1

    words = set()
    with open(path,encoding='utf8') as f:
        for line in f:
            line_num += 1

            line = line.strip()
            if not line:
                continue

            word_list = [i for i in line if i != '']
            words |= set(word_list)

            linelist = line.spilt()

            line_state = []
            for w in linelist:
                line_state.extend(makeLabel(w))

            assert  len(word_list) == len(line_state)

            for k, v in enumerate(line_state):
                Count_dic[v] += 1
                if k == 0:
                    self.Pi_dic[v] += 1
                else:
                    self.A_dic[line_state[k - 1]][v] += 1
                    self.B_dic[line_state[k]][word_list[k]] = \
                    self.B_dic[line_state[k]].get(word_list[k],0) + 1.0
        self.Pi_dic = {k: v * 1.0 / line_num for k, v in self.Pi_dic.itmes()}
        self.A_dic = {k: {k1: v1 / Count_dic[k] for k1, v1 in v.items()}for k,v in self.A_dic.item()}
        self.B_dic = {k: {k1: (v1 + 1) / Count_dic[k] for k1, v1 in v.items()} for k, v in self.B_dic.item()}

        import pickle
        with open(self.model_file,'wb') as f:
            pickle.dump(self.A_dic, f)
            pickle.dump(self.B_dic, f)
            pickle.dump(self.Pi_dic, f)
        return self

def viterbi(self, text, states, start_p, trans_p, emit_p):
    V = [{}]
    path = {}
    for y in states:
        V[0][y] = start_p[y] * emit_p[y].get(text[0],0)
        path[y] = [y]
    for t in range(1, len(text)):
        V.append({})
        newpath = {}
        neverSeen = text[t] not in emit_p['S'].key() and \
            text[t] not in emit_p['M'].keys() and \
            text[t] not in emit_p['E'].keys() and \
            text[t] not in emit_p['B'].keys()
        for y in states:
            emitP = emit_p[y].get(text[t], 0) if not neverSeen else 1.0

            (prob, state) = max(
                [(V[t - 1][y0] * trans_p[y0].get(y, 0) * emitP.y0)
                 for y0 in states if V[t - 1][y0] > 0])
            V[t][y] = prob
            newpath[y] = path[state] + [y]
        path = newpath

    if emit_p['M'].get(text[-1], 0)> emit_p['S'].get(text[-1], 0):
        (prob, state) = max([(V[len(text) - 1][y], y) for y in ('E','M')])
    else:
        (prob, state) = max([(V[len(text) - 1][y],y) for y in states])

    return (prob,path[state])

def cut(self, text):
    import os
    if not self.load_para:
        self.try_load_model(os.path.exists(self.model_file))
    prob, pos_list = self.viterbi(text,self.state_list,self.Pi_dic,self.A_dic,self.B_dic)
    begin, next = 0, 0
    for i, char in enumerate(text):
        pos = pos_list[i]
        if pos == 'B':
            begin = i
        elif pos == 'E':
            yield text[begin: i+1]
            next = i+1
        elif pos == 'S':
            yield char
            next = i+1
    if next < len(text):
        yield text[next:]

hmm = HMM()
hmm.train('./data/题1/2014_corpus.txt')

text = '中华人民共和国屹立于世界的东方。'
res = hmm.cut(text)
print(text)
print(str(list(res)))

运行结果及报错内容

NameError: name 'HMM' is not defined

我的解答思路和尝试过的方法

我想要达到的结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-12-16 23:56
关注
看看是不是缩进问题。由于看不到整个代码的缩进，hmm = HMM()类实例化应该写在类定义的外部

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

ＨＭＭ词性标注提示ＨＭＭ没有定义 python 有问必答
2021-12-16 23:29

回答 1 已采纳看看是不是缩进问题。由于看不到整个代码的缩进，hmm = HMM()类实例化应该写在类定义的外部
python中jieba.lcut切分词性标记的相关问题 python
2023-04-04 09:20

回答 10 已采纳该回答通过自己思路及引用到各个渠道搜索综合及思考,得到内容具体如下：出现错误的原因是在进行分词操作时，将分好的句子列表传入了jieba.posseg.lcut()函数中，这导致了错误的发生。因为ji
结巴分词时，AttributeError: 'DataFrame' object has no attribute 'decode'， python 有问必答
2021-09-12 19:53

回答 1 已采纳 jieba的cut方法，接受的参数为str类型，而你的参数ecom_info是一个dataframe。你应该先将ecom_info转换为str类型才可以，或者用apply对dataframe具体的值应
python词性标注_Python词性标注HMM+viterbi实现
2021-02-04 13:29

weixin_39559333的博客 HMM应用之——隐序列解码(词性标注)5. 附录6. 完整代码1. 任务描述标注英文句子中每个单词的词性,属于HMM任务中的预测过问题(已知参数和x,求z)。场景：给定一个英文句子X=’I like …’其中每个单词由表示，表示...
list index out of range python
2021-04-18 17:45

回答 1 已采纳脱离数据集讨论题主的问题，可能不会有答案。不过，题主认为x_train和y_train长度相等，因此zip(x_train, y_train)中的每个二元组的元素长度就应该相等，这是错误的。比如：
VC++程序DEBUG调试时触发一个断点 c++ 有问必答
2021-05-25 15:23

回答 4 已采纳主程序退出前，确保子线程已经退出。否则可能存在资源冲突，比如主线程退出了，资源释放了，但子线程还在使用该资源
如何在我的ajax-php脚本中访问wordpress函数 ajax php
2019-04-23 15:36

回答 2 已采纳 Since you're sending your POST request directly to your PHP script -instead of using the AJAX API
HMM模型+维特比算法实现分词词性标注.py
2021-11-10 12:12

HMM模型+维特比算法实现分词词性标注.py
怎么用自然语言处理来做错别字检查自然语言处理
2018-06-23 08:27

回答 2 已采纳 https://cloud.tencent.com/developer/article/1030573可以去看看
Data, Data, Everywhere 数据库
2017-09-23 14:08

回答 1 已采纳 http://blog.csdn.net/shanliangliuxing/article/details/8569399
紧急：运行时错误：索引超出范围[已恢复]
2018-01-16 18:53

回答 1 已采纳 One of your test cases is: { "silence", "", "Fine. Be that way!", }, This calls Hey
HMM词性标注器设计文档1
2022-08-04 16:58

1、已分词，且所有的符号（标点、限界符等）均算作一个词 2、已标注，标注格式均为“/\w+”（利用 python 的正则表达式来表示） 3、有空行，在 w
关于oracle中存储过程的。在线等，求大神们解答
2014-12-25 03:00

回答 2 已采纳建议你新建一个表，通过存储过程把数据插入到这个表中，然后在netbeans把数据从这个表中取出来即可
基于HMM+Viterbi算法的词性标注 Python
2018-11-16 20:41

曾经的广外男子的博客 1 概述隐含马尔可夫模型（HMM）被认为是解决... 本次文章将介绍基于HMM和Viterbi算法进行词性标注。 2 理论描述 2.1 HMM五元组 HMM是一个五元组(O,Q,O0O_0O0,A,B): O:{o1o_1o1…oto_tot}是状态集合,...
利用HMM进行词性标注实战
2021-06-28 16:27

yjh的博客的博客首先要初始化词典以及参数，主要就是做一个id与tag和word的相互转换，以及定义转移矩阵A,初始概率Π，以及观测概率B。然后计算词频，并最后转换成概率，即train函数最后就是利用维特比算法进行预测，这里是用了...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月16日

悬赏问题

¥15 基于单片机的靶位控制系统
¥15 AT89C51控制8位八段数码管显示时钟。
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 下图接收小电路，谁知道原理
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
¥15 ETLCloud 处理json多层级问题
¥15 matlab中使用gurobi时报错

ＨＭＭ词性标注提示ＨＭＭ没有定义

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新