ChingKai Chau 2022-12-29 13:12 采纳率: 28.6%
浏览 52
已结题

python读取txt无法识别’\n‘

如题,本人在进行命名实体识别时需要处理txt文本数据,由于该数据中存在'\n'换行符,因此需要加一个判断来处理,但python程序似乎无法识别'\n',写的判断语句并没有将txt中的'\n'识别出来。以下是部分代码:
python程序:

        with open("train1.txt", 'r', encoding='utf-8') as f:
            word_list = []
            tag_list = []
            i=1
            for line in f:
                print(line,i)
                i+=1
                if line != '\n':
                    word, tag = line.strip('\n').split()
                    word_list.append(word)
                    tag_list.append(tag)
                else:
                    print(word_list)
                    word_lists.append(word_list)
                    tag_lists.append(tag_list)
                    word_list = []
                    tag_list = []

txt数据预览:

img

报错信息:
ValueError: not enough values to unpack (expected 2, got 0)

  • 写回答

3条回答 默认 最新

  • wux_labs 2022-12-29 13:28
    关注

    检查文件格式,如果是Windows上的文件格式,空白行是if line != '\r\n',如果是Linux则是\n。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 1月6日
  • 已采纳回答 12月29日
  • 修改了问题 12月29日
  • 创建了问题 12月29日