aingWM 2019-08-13 23:47 采纳率: 50%
浏览 405
已采纳

我们进行文本文字的复制粘贴时复制的到底是什么?

复制的是文字所处文本文件的编码方案下的编码值吗?

比如文本文件采用UTF-8编码,复制文件中的“中文”两字时,复制的是这两个字的UTF-8编码值(即 E4 B8 AD E6 96 87)共 6 个字节的二进制数据吗?

如果是这样,那我粘贴到 GBK 编码的记事本中时,为什么没有出现乱码现象呢?

难道是粘贴时对编码进行了调整,调整为了 GBK 这种编码方案下的“中文”这两字的编码值了吗?可是记事本又怎么知道这 6 个字节的二进制数据是 UTF-8 编码方案下的“中文”这两字,而不是别的什么编码方案(比如 Big5, Shift-JIS等)下的别的什么字呢?

  • 写回答

1条回答 默认 最新

  • threenewbee 2019-08-15 00:25
    关注

    对于纯文本,其实是不知道编码,编码是编辑器(包括文本框)作为软件猜测的。别的格式,比如ole或者自定义格式,那另当别论。

    看下面的图
    图片说明

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog