m0_69339309 2023-11-15 21:25 采纳率: 20%
浏览 13
已结题

jieba分词结果保存

[[‘奇奇怪怪’,‘看不下去’],[‘封控’,‘过期’,‘检测’]]
像这样的嵌套列表怎么可以转成excel或txt保存呢
我用这串代码保存的结果是乱码
df=pdf.DataFrame(wordList)
df.to_excel('result.xlsx')

  • 写回答

12条回答 默认 最新

  • 专家-赤兔[在线] 全栈领域优质创作者 2023-11-15 21:26
    关注

    引自强大而免费的微信小程序:皆我百晓生

    1. 加载jieba库
    首先,我们需要加载jieba分词库,用于对文本进行分词处理。

    import jieba
    

    2. 进行分词
    接下来,我们需要将待处理的文本进行分词操作。假设我们有一个嵌套列表wordList,其中包含了需要分词的文本数据。

    wordList = [['奇奇怪怪', '看不下去'], ['封控', '过期', '检测']]
    result = []
    
    for lst in wordList:
        wordList_temp = []
        for word in lst:
            segmented_word = jieba.lcut(word)  # 使用jieba进行分词
            wordList_temp.extend(segmented_word)  # 将分词结果添加到临时列表中
        result.append(wordList_temp)  # 将临时列表添加到结果列表中
    

    3. 保存结果为Excel文件
    接下来,我们可以将分词结果保存为Excel文件。使用pandas库可以方便地实现该功能。

    import pandas as pd
    
    df = pd.DataFrame(result)  # 创建DataFrame对象
    df.to_excel('result.xlsx')  # 将DataFrame保存为Excel文件
    

    完整代码示例:

    import jieba
    import pandas as pd
    
    wordList = [['奇奇怪怪', '看不下去'], ['封控', '过期', '检测']]
    result = []
    
    for lst in wordList:
        wordList_temp = []
        for word in lst:
            segmented_word = jieba.lcut(word)
            wordList_temp.extend(segmented_word)
        result.append(wordList_temp)
    
    df = pd.DataFrame(result)
    df.to_excel('result.xlsx')
    

    运行以上代码,即可将分词结果保存为名为result.xlsx的Excel文件。请确保已经安装了jieba和pandas库。

    评论 编辑记录

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 11月16日
  • 创建了问题 11月15日

悬赏问题

  • ¥15 模电中二极管,三极管和电容的应用
  • ¥15 关于模型导入UNITY的.FBX: Check external application preferences.警告。
  • ¥15 气象网格数据与卫星轨道数据如何匹配
  • ¥100 java ee ssm项目 悬赏,感兴趣直接联系我
  • ¥15 微软账户问题不小心注销了好像
  • ¥15 x264库中预测模式字IPM、运动向量差MVD、量化后的DCT系数的位置
  • ¥15 curl 命令调用正常,程序调用报 java.net.ConnectException: connection refused
  • ¥20 关于web前端如何播放二次加密m3u8视频的问题
  • ¥15 使用百度地图api 位置函数报错?
  • ¥15 metamask如何添加TRON自定义网络