ＨＭＭ词性标注提示ＨＭＭ没有定义

问题遇到的现象和发生背景

ＨＭＭ怎么会没有定义

问题相关代码，请勿粘贴截图

class HMM(object):
def init(self):
pass

def try_load_model(self,trained):
    pass

def train(self,path):
    pass

def viterbi(self,text,states,start_p,trans_p,emit_p):
    pass

def cut(self,text):
    pass

def __int__(self):
    import os

    self.model_file = './data/hmm_model.pkl'

    self.state_list = ['B','M','E','S']

    self.load_para = False

def try_load_model(self,trained):
    if trained:
        import pickle
        with open(self.model_file,'rb') as f:
            self.A_dic = pickle.load(f)
            self.B_dic = pickle.load(f)
            self.Pi_dic = pickle.load(f)
            self.load_para = True
    else:
        self.A_dic = {}
        self.B_dic = {}
        self.Pi_dic = {}
        self.load_para = False

def train(self,path):

    self.try_load_model(False)

    Count_dic = {}

    def init_parameters():
        for state in self.state_list:
            self.A_dic[state] = {s:0.0 for s in self.state_list}
            self.Pi_dic[state] = 0.0
            self.B_dic[state] = {}

            Count_dic[state] = 0

    def makeLabel(text):
        out_text = []
        if len(text) == 1:
            out_text.append('S')
        else:
            out_text += ['B'] + ['M'] * (len(text) -2) + ['E']
        return out_text

    init_parameters()
    line_num = -1

    words = set()
    with open(path,encoding='utf8') as f:
        for line in f:
            line_num += 1

            line = line.strip()
            if not line:
                continue

            word_list = [i for i in line if i != '']
            words |= set(word_list)

            linelist = line.spilt()

            line_state = []
            for w in linelist:
                line_state.extend(makeLabel(w))

            assert  len(word_list) == len(line_state)

            for k, v in enumerate(line_state):
                Count_dic[v] += 1
                if k == 0:
                    self.Pi_dic[v] += 1
                else:
                    self.A_dic[line_state[k - 1]][v] += 1
                    self.B_dic[line_state[k]][word_list[k]] = \
                    self.B_dic[line_state[k]].get(word_list[k],0) + 1.0
        self.Pi_dic = {k: v * 1.0 / line_num for k, v in self.Pi_dic.itmes()}
        self.A_dic = {k: {k1: v1 / Count_dic[k] for k1, v1 in v.items()}for k,v in self.A_dic.item()}
        self.B_dic = {k: {k1: (v1 + 1) / Count_dic[k] for k1, v1 in v.items()} for k, v in self.B_dic.item()}

        import pickle
        with open(self.model_file,'wb') as f:
            pickle.dump(self.A_dic, f)
            pickle.dump(self.B_dic, f)
            pickle.dump(self.Pi_dic, f)
        return self

def viterbi(self, text, states, start_p, trans_p, emit_p):
    V = [{}]
    path = {}
    for y in states:
        V[0][y] = start_p[y] * emit_p[y].get(text[0],0)
        path[y] = [y]
    for t in range(1, len(text)):
        V.append({})
        newpath = {}
        neverSeen = text[t] not in emit_p['S'].key() and \
            text[t] not in emit_p['M'].keys() and \
            text[t] not in emit_p['E'].keys() and \
            text[t] not in emit_p['B'].keys()
        for y in states:
            emitP = emit_p[y].get(text[t], 0) if not neverSeen else 1.0

            (prob, state) = max(
                [(V[t - 1][y0] * trans_p[y0].get(y, 0) * emitP.y0)
                 for y0 in states if V[t - 1][y0] > 0])
            V[t][y] = prob
            newpath[y] = path[state] + [y]
        path = newpath

    if emit_p['M'].get(text[-1], 0)> emit_p['S'].get(text[-1], 0):
        (prob, state) = max([(V[len(text) - 1][y], y) for y in ('E','M')])
    else:
        (prob, state) = max([(V[len(text) - 1][y],y) for y in states])

    return (prob,path[state])

def cut(self, text):
    import os
    if not self.load_para:
        self.try_load_model(os.path.exists(self.model_file))
    prob, pos_list = self.viterbi(text,self.state_list,self.Pi_dic,self.A_dic,self.B_dic)
    begin, next = 0, 0
    for i, char in enumerate(text):
        pos = pos_list[i]
        if pos == 'B':
            begin = i
        elif pos == 'E':
            yield text[begin: i+1]
            next = i+1
        elif pos == 'S':
            yield char
            next = i+1
    if next < len(text):
        yield text[next:]

hmm = HMM()
hmm.train('./data/题1/2014_corpus.txt')

text = '中华人民共和国屹立于世界的东方。'
res = hmm.cut(text)
print(text)
print(str(list(res)))

运行结果及报错内容

NameError: name 'HMM' is not defined

我的解答思路和尝试过的方法

我想要达到的结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-12-16 23:56
关注
看看是不是缩进问题。由于看不到整个代码的缩进，hmm = HMM()类实例化应该写在类定义的外部

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python中jieba.lcut切分词性标记的相关问题 python
2023-04-04 09:20

回答 10 已采纳该回答通过自己思路及引用到各个渠道搜索综合及思考,得到内容具体如下：出现错误的原因是在进行分词操作时，将分好的句子列表传入了jieba.posseg.lcut()函数中，这导致了错误的发生。因为ji
Linux非root用户安装了hmmer，但是装另外一个包（需要hmmer）的时候还是提示找不到hmmpress linux python
2022-05-14 14:44

回答 1 已采纳第一步操作的时候没有任何报错吗?先测试下python是否存在该包 python3 -m hmmer 如果没有的话就需要考虑路径问题或者进一步排查其他问题了或者尝试下直接安装是否可以正常进行下一步安
结巴分词时，AttributeError: 'DataFrame' object has no attribute 'decode'， python 有问必答
2021-09-12 19:53

回答 1 已采纳 jieba的cut方法，接受的参数为str类型，而你的参数ecom_info是一个dataframe。你应该先将ecom_info转换为str类型才可以，或者用apply对dataframe具体的值应
python词性标注_Python词性标注HMM+viterbi实现
2021-02-04 13:29

weixin_39559333的博客 HMM应用之——隐序列解码(词性标注)5. 附录6. 完整代码1. 任务描述标注英文句子中每个单词的词性,属于HMM任务中的预测过问题(已知参数和x,求z)。场景：给定一个英文句子X=’I like …’其中每个单词由表示，表示...
list index out of range python
2021-04-18 17:45

回答 1 已采纳脱离数据集讨论题主的问题，可能不会有答案。不过，题主认为x_train和y_train长度相等，因此zip(x_train, y_train)中的每个二元组的元素长度就应该相等，这是错误的。比如：
VC++程序DEBUG调试时触发一个断点 c++ 有问必答
2021-05-25 15:23

回答 4 已采纳主程序退出前，确保子线程已经退出。否则可能存在资源冲突，比如主线程退出了，资源释放了，但子线程还在使用该资源
如何在我的ajax-php脚本中访问wordpress函数 ajax php
2019-04-23 15:36

回答 2 已采纳 Since you're sending your POST request directly to your PHP script -instead of using the AJAX API
HMM模型+维特比算法实现分词词性标注.py
2021-11-10 12:12

HMM模型+维特比算法实现分词词性标注.py
怎么用自然语言处理来做错别字检查自然语言处理
2018-06-23 08:27

回答 2 已采纳 https://cloud.tencent.com/developer/article/1030573可以去看看
Data, Data, Everywhere 数据库
2017-09-23 14:08

回答 1 已采纳 http://blog.csdn.net/shanliangliuxing/article/details/8569399
紧急：运行时错误：索引超出范围[已恢复]
2018-01-16 18:53

回答 1 已采纳 One of your test cases is: { "silence", "", "Fine. Be that way!", }, This calls Hey
HMM词性标注器设计文档1
2022-08-04 16:58

【HMM词性标注器设计文档1】该文档详述了一个基于隐马尔科夫模型（Hidden Markov Model, HMM）的词性标注器的设计和实现。词性标注是自然语言处理中的基础任务，其目的是给文本中的每个词汇赋予正确的词性标签，如...
基于HMM+Viterbi算法的词性标注 Python
2018-11-16 20:41

曾经的广外男子的博客 1 概述隐含马尔可夫模型（HMM）被认为是解决... 本次文章将介绍基于HMM和Viterbi算法进行词性标注。 2 理论描述 2.1 HMM五元组 HMM是一个五元组(O,Q,O0O_0O0,A,B): O:{o1o_1o1…oto_tot}是状态集合,...
利用HMM进行词性标注实战
2021-06-28 16:27

yjh的博客的博客首先要初始化词典以及参数，主要就是做一个id与tag和word的相互转换，以及定义转移矩阵A,初始概率Π，以及观测概率B。然后计算词频，并最后转换成概率，即train函数最后就是利用维特比算法进行预测，这里是用了...
基于HMM的中文词性标注 POSTagging
2019-12-20 00:33

Michael阿明的博客 词性标注1.1 概念1.2 任务1.3 预处理1.4 初步统计预览2. 最大概率模型2.1 训练2.2 预测2.3 结果评估3. 隐马尔科夫HMM模型本文的代码是在徐老师的代码基础上，自己加了些注释，在此表示感谢！ 1. 词性标注 1.1 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月16日

悬赏问题

¥30 Matlab打开默认名称带有/的光谱数据
¥50 easyExcel模板动态单元格合并列
¥15 res.rows如何取值使用
¥15 在odoo17开发环境中，怎么实现库存管理系统，或独立模块设计与AGV小车对接？开发方面应如何设计和开发？请详细解释MES或WMS在与AGV小车对接时需完成的设计和开发
¥15 CSP算法实现EEG特征提取，哪一步错了？
¥15 游戏盾如何溯源服务器真实ip?需要30个字。后面的字是凑数的
¥15 vue3前端取消收藏的不会引用collectId
¥15 delphi7 HMAC_SHA256方式加密
¥15 关于#qt#的问题：我想实现qcustomplot完成坐标轴
¥15 下列c语言代码为何输出了多余的空格

ＨＭＭ词性标注提示ＨＭＭ没有定义

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新