预训练模型ErnieModel怎么能像BertModel获得所有encoder层的hidden_states呢？

在用BertModel时是没问题的，但是Ernie就不行，ErnieModel的代码里明明有output_hidden_states这个参数的

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
哇小侠 2023-01-12 04:33
关注
ErnieModel 和 BertModel 是在不同的模型预训练框架上进行训练的，它们在模型结构和输出上可能有所不同。

在使用 BertModel 时可以直接通过设置 output_hidden_states=True 来获取所有 encoder 层的隐藏状态，但是在 ErnieModel 中并不支持这样的参数。

那么在使用 ErnieModel 时，获取所有 encoder 层的隐藏状态的方法是什么呢？

一个方法是在模型预测时，自己手动遍历模型的各层，获取对应的隐藏状态，这种方法稍微有点复杂，需要对模型结构有一定的了解

另一个更加简单的方法是使用 HuggingFace 的 Transformers 库中的 ErnieModel 类，它在模型预测时自动提供了所有层的隐藏状态。

from transformers import ErnieModel, ErnieTokenizer model = ErnieModel.from_pretrained('ernie-base-cased') input_ids = tokenizer.encode(text) hidden_states = model(input_ids)[-1]

在上面的例子中，“hidden_states”就是所有encoder层的隐藏状态。其中 hidden_states[-1] 就是最后一层的状态,hidden_states[-2] 是倒数第二层的状态，以此类推。

获取所有层的状态请使用 hidden_states[:-1],这样就可以得到一个List, 数组里面是所有层的状态。
注：在上面代码中使用 ErnieModel.from_pretrained('ernie-base-cased') 会从预训练模型中加载"ernie-base-cased"这个模型，这个参数可以根据需要更换为其他预训练模型。

对于 tokenizer 也可以用 ErnieTokenizer.from_pretrained('ernie-base-cased') 来加载预训练好的 tokenizer, 这样就能获得输入文本的id.

此外，可能需要根据具体的需求来分析选择哪些层的隐藏状态。因此还需要结合具体的场景和目的来使用这些隐藏状态。
解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容