m0_69339309 2023-11-15 21:25 采纳率: 20%
浏览 19
已结题

jieba分词结果保存

[[‘奇奇怪怪’,‘看不下去’],[‘封控’,‘过期’,‘检测’]]
像这样的嵌套列表怎么可以转成excel或txt保存呢
我用这串代码保存的结果是乱码
df=pdf.DataFrame(wordList)
df.to_excel('result.xlsx')

  • 写回答

12条回答 默认 最新

  • 专家-赤兔[在线] 优质创作者: 编程框架技术领域 2023-11-15 21:26
    关注

    引自强大而免费的微信小程序:皆我百晓生

    1. 加载jieba库
    首先,我们需要加载jieba分词库,用于对文本进行分词处理。

    import jieba
    

    2. 进行分词
    接下来,我们需要将待处理的文本进行分词操作。假设我们有一个嵌套列表wordList,其中包含了需要分词的文本数据。

    wordList = [['奇奇怪怪', '看不下去'], ['封控', '过期', '检测']]
    result = []
    
    for lst in wordList:
        wordList_temp = []
        for word in lst:
            segmented_word = jieba.lcut(word)  # 使用jieba进行分词
            wordList_temp.extend(segmented_word)  # 将分词结果添加到临时列表中
        result.append(wordList_temp)  # 将临时列表添加到结果列表中
    

    3. 保存结果为Excel文件
    接下来,我们可以将分词结果保存为Excel文件。使用pandas库可以方便地实现该功能。

    import pandas as pd
    
    df = pd.DataFrame(result)  # 创建DataFrame对象
    df.to_excel('result.xlsx')  # 将DataFrame保存为Excel文件
    

    完整代码示例:

    import jieba
    import pandas as pd
    
    wordList = [['奇奇怪怪', '看不下去'], ['封控', '过期', '检测']]
    result = []
    
    for lst in wordList:
        wordList_temp = []
        for word in lst:
            segmented_word = jieba.lcut(word)
            wordList_temp.extend(segmented_word)
        result.append(wordList_temp)
    
    df = pd.DataFrame(result)
    df.to_excel('result.xlsx')
    

    运行以上代码,即可将分词结果保存为名为result.xlsx的Excel文件。请确保已经安装了jieba和pandas库。

    评论 编辑记录

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 11月16日
  • 创建了问题 11月15日