「已注销」 2023-04-07 17:20 采纳率: 0%
浏览 25

pythonjieba分词

提问
jieba分词我想保留连续的”适得其反”这个词,
但是结果出来老是断成【适得 其反】,该怎么在下面的代码里写

img

  • 写回答

3条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2023-04-07 20:31
    关注
    • 你可以看下这个问题的回答https://ask.csdn.net/questions/7438759
    • 我还给你找了一篇非常好的博客,你可以看看是否有帮助,链接:python jieba分词,图片打印清晰,设停用词,去英文
    • 除此之外, 这篇博客: python中jieba分词使用基本介绍中的 结巴分词的三种模式 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
    • # encoding=utf-8
      # 分词模式介绍
      import jieba
      seg_list = jieba.cut("我来到北京清华大学", cut_all=True)
      print("Full Mode: " + "/ ".join(seg_list))  # 全模式
      
      seg_list = jieba.cut("我来到北京清华大学", cut_all=False)
      print("Default Mode: " + "/ ".join(seg_list))  # 精确模式
      
      seg_list = jieba.cut("他来到了网易杭研大厦")  # 默认是精确模式
      print(", ".join(seg_list))
      
      seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造")  # 搜索引擎模式
      print(", ".join(seg_list))
      type(seg_list)
      

      输出结果如下
      在这里插入图片描述

    • 您还可以看一下 钱兴会老师的从零开始自然语言处理课程中的 自己构建jieba分词的停词库,提升分词质量小节, 巩固相关知识点
    评论

报告相同问题?

问题事件

  • 创建了问题 4月7日

悬赏问题

  • ¥15 WPF动态创建页面内容
  • ¥15 如何对TBSS的结果进行统计学的分析已完成置换检验,如何在最终的TBSS输出结果提取除具体值及如何做进一步相关性分析
  • ¥15 SQL数据库操作问题
  • ¥100 关于lm339比较电路出现的问题
  • ¥15 Matlab安装yalmip和cplex功能安装失败
  • ¥15 加装宝马安卓中控改变开机画面
  • ¥15 STK安装问题问问大家,这种情况应该怎么办
  • ¥15 关于罗技鼠标宏lua文件的问题
  • ¥15 halcon ocr mlp 识别问题
  • ¥15 已知曲线满足正余弦函数,根据其峰值,还原出整条曲线