最近准备对B站标签做一个流处理,写了以下代码
上面是从log文件夹里面读数据,log文件夹是一个不断生成日志文件的文件夹,相关代码已经写好,只是上面的代码有问题,我通过打印这个record发现得到的key的值都是乱码,不是我想要的中文,我的数据来自以下这张图 可是控制台和写入的文件是这样的:
我写了好多种编码的方式,我发现好像从计算word的数量那段代码就开始出错了,不知道为什么。
恳请各位大神指教!!!
收起
当前问题酬金
¥ 0 (可追加 ¥500)
支付方式
扫码支付
支付金额 15 元
提供问题酬金的用户不参与问题酬金结算和分配
支付即为同意 《付费问题酬金结算规则》
https://blog.csdn.net/qq_28666339/article/details/79234301
报告相同问题?