AHIOSUZ 2014-12-10 10:10 采纳率: 0%
浏览 2144
已采纳

awk脚本处理文本遇见→符号,二进制为0x1a,当做EOF的问题

111 222 333
444 555 666→
777 888 999

BEGIN{IGNORECASE = 1; FS = " "; RS = "\n"}
{
print "第"NR"条记录共"NF"个字段",$0
}

上面→ 二进制代码为0x1a,被awk当成EOF处理,随意结果是
第1条记录共3个字段 111 222 333
第2条记录共3个字段 444 555 666
第三行读不出来,因为遇见那个箭头符号,然后当成EOF,之后都不处理了。

该怎么解决这个问题,让代码能忽视掉那个箭头(0x1a)呢
求大神们,帮帮忙

  • 写回答

1条回答 默认 最新

  • xuzuning 2014-12-10 10:22
    关注

    十六进制的 0x1a 是文本文件的文件结束符,因为是不可打印字符,本来就不该在文本文件中出现
    文本文件中只应该存在以下控制符:0x09 制表符、0x0a 换行符和 0x0d 回车符(windows才有)
    若要忽略对他的处理,需要以二进制方式打开文件

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 爬取豆瓣电影相关处理
  • ¥15 手机淘宝抓清除消息接口
  • ¥15 C#无selenium
  • ¥15 LD衰减计算的结果过大
  • ¥15 用机器学习方法帮助保险公司预测哪些是欺诈行为
  • ¥15 计算300m以内的LD衰减
  • ¥15 数据爬取,python
  • ¥15 怎么看 cst中一个面的功率分布图,请说明详细步骤。类似下图
  • ¥15 为什么我的pycharm无法用pyqt6的QtWebEngine
  • ¥15 FOR循环语句显示查询超过300S错误怎么办