狗屁大王 2023-11-19 13:52 采纳率: 100%
浏览 7
已结题

关于#sentencepiece#的问题,如何解决?

#问题

img

#尝试了以下两种方法
(1)pip install sentencepiece
(2)uninstall transformers → pip install --no-cache-dir transformers sentencepiece → Use_fast= False like this: tokenizer = AutoTokenizer.from_pretrained(“XXXXX”, use_fast=False)

#结果
通通无效T_T,有时候真的想报警,jiu jiu hai zi 吧!

  • 写回答

3条回答 默认 最新

  • 社区专家-Monster-XH 2023-11-19 13:57
    关注

    1.首先 先安装库

    pip install sentencepiece
    
    
    

    2.直接使用特定的tokenizer类,例如RobertaTokenizer,而不是AutoTokenizer

    from transformers import RobertaTokenizer
    tokenizer = RobertaTokenizer.from_pretrained('model_name', use_fast=False)
    
    
    

    将'model_name'替换为你实际要加载的模型名称。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 11月27日
  • 已采纳回答 11月19日
  • 创建了问题 11月19日

悬赏问题

  • ¥50 rk3588板端推理
  • ¥50 opencv怎么去掉 数字0中间的斜杠。
  • ¥15 这种情况的伯德图和奈奎斯特曲线怎么分析?
  • ¥50 paddleocr带斜线的0很容易识别成9
  • ¥15 电子档案元素采集(tiff及PDF扫描图片)
  • ¥15 flink-sql-connector-rabbitmq使用
  • ¥15 zynq7015,PCIE读写延时偏大
  • ¥15 使用spss做psm(倾向性评分匹配)遇到问题
  • ¥20 vue+UEditor附件上传问题
  • ¥15 想做个WPS的自动化代码,不知道能做的起不。