字符编码的相关知识联想到本地二进制代码困惑

最近在看字符编码的相关知识，又联想到二进制代码的知识，由于本人不是科班出身，对一些二进制代码即本地代码了解不深，所以有几个问题感到很困惑，所以希望懂相关知识的人帮我顺一顺。
VS默认是将文本本件(包括cs文件)以utf-8编码方案编码成字节的，举个例子

我们AaBb经过utf-8编码后是E6 88 91 E4 BB AC 41 61 42 62
E6 88 91(代表我) E4 BB AC(代表们) 41(A) 61(a) 42(B) 62(b)

[color=red]第一个问题：[/color]我是不是可以认为将这些16进制转换成2进制后就是我们AaBb 在计算机的存储方式? 如下
11100110 10001000 10010001(代表我) 11100100 10111011 10101100(代表们) 1000001(A) 1100001(b) 1000010(B) 1100010(b)

如果换成是utf-16编码的 Little_Edian方式(每个字符占2个字节) 就是
11 62(代表我) EC 4E(代表们) 41 00(A) 61 00(a) 42 00(B) 62 00(b)

既然说到了2进制，我就想起了本地代码，从开始学语言的时候就看到各种各样的人说机器语言是01010这种2进制云云...
那么对于C# java先看一下下面
源代码 C#,java
↓
托管代码 .NET:IL(中间语言) JAVA:字节码等
↓
非托管代码(本地代码，二进制代码，机器语言)http://baike.baidu.com/view/2418160.htm

首先看源代码，如果我们只是保存它们，当然就是像上面那样用某种编码方式将其保存成字节
[color=red]第2个问题：[/color]如果我们对源代码进行了编译，使其变成了托管代码，windows下的托管代码叫做可移植执行体，那么这些托管代码肯定也是以2进制形式存储在硬盘里，那么这时的我们编译得来2进制形式与我们直接保存得来的2进制形式的区别在哪里?

[color=red]第3个问题：[/color]当将托管代码编译成本地代码后，啊哈，这就是人们常说的本地2进制代码，这些本地2进制代码与之前的托管2进制代码的区别在哪里? 我知道后者要依赖CLR或jvm，但除此之外呢?

看了上面的提问，感觉我要问的好像是编译的得到的2进制代码与编码得到的2进制代码有什么区别，然后是编译源代码得到的2进制代码与编译托管代码得到的2进制代码有什么区别。

[color=red]第4个问题：[/color]既然编码字符需要考虑编码方案的问题，那么图片视频呢? 就拿.net中socket传输字符串来讲也是需要考虑编码方案的，为什么传输图片就不需要考虑编码呢? 图片不是也有jpg gif等好多格式吗?

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
wlx0710 2012-03-26 13:58
关注
:o 一下子问4个问题，才给5分。。。 :cry:

第一个问题：我是不是可以认为将这些16进制转换成2进制后就是我们AaBb 在计算机的存储方式?

A：16进制和2进制都只是数字的一种表示形式，是外在的表现，对内在的实际涵意没有任何影响。

你可以这么理解，机器读2进制比较方便，因为简单。人读16进制比较方便，因为简略。

第2个问题：如果我们对源代码进行了编译，使其变成了托管代码，windows下的托管代码叫做可移植执行体，那么这些托管代码肯定也是以2进制形式存储在硬盘里，那么这时的我们编译得来2进制形式与我们直接保存得来的2进制形式的区别在哪里?

A：这涉及到编译原理的问题，当然这里可以用比较通俗的方式讲就是，你的代码都是用文本方法写的，所以直接保存的也都是字符串，人可以理解是代码，但机器只能识别为字符串。要想让机器识别成可执行的代码，那就要通过一定的规则转换成机器码。转换后机器就可以执行了，但人去看就是一堆乱码了。

第3个问题：当将托管代码编译成本地代码后，啊哈，这就是人们常说的本地2进制代码，这些本地2进制代码与之前的托管2进制代码的区别在哪里? 我知道后者要依赖CLR或jvm，但除此之外呢?

A:首先，你要明白为什么要分成“托管代码”和“本地代码”，这主要是因为执行平台的不同，导致你要写多种不同的代码来实现相同的功能。为了解决这个问题，就出现了“虚拟机”如JVM，这样的东西。主要的原理就是你根据“虚拟机”所提供的功能来实现业务逻辑，我为不同的平台开发做不同的“虚拟机”来实现我所提供的功能，这样就可以跨平台了。剩下的你应该明白一点了吧

第4个问题：既然编码字符需要考虑编码方案的问题，那么图片视频呢? 就拿.net中socket传输字符串来讲也是需要考虑编码方案的，为什么传输图片就不需要考虑编码呢? 图片不是也有jpg gif等好多格式吗?

A：说简单点，因为图片是大文件，可以有自己的文件格式，比如，GIF文件的文件头就是git，ZIP文件的文件头就是'PK'等等，所以它们都可以被很容易的识别。

而字符串不一样，它们很零碎，种类也很多。如GBK，是中文的编码，里面只有中文和英文，而UTF-8是包含了所有的语言。他们实现上就是通过对数字的分段来实现识别不同的文字。当然识别的越多所需要的数字就越大，所需要的存储空间和网络流量就越多，所以在socket里尽量选择合适的编码，来提高性能。

就说这么多吧，希望能给你一点小小的帮助 :lol:

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

字符编码的相关知识联想到本地二进制代码困惑 c++
2012-03-25 20:56

回答 1 已采纳 :o 一下子问4个问题，才给5分。。。 :cry: 第一个问题：我是不是可以认为将这些16进制转换成2进制后就是我们AaBb 在计算机的存储方式? A：16进制和2进制都只是数字的一
二进制字符串到十六进制
2018-09-04 18:44

回答 1 已采纳 You can do the exact same thing the other way, since ParseInt allows you to pass the base of the n
字符串转二进制和十六进制字符串 c语言有问必答
2021-11-15 10:56

回答 2 已采纳代码如下： #include <stdio.h> //转2进制字符串 void fun(char ch,char buf[]) { int i,t,n=7; for(i=0
编程常用英语单词，文末有我工作中收集的自用的
2019-04-16 15:30

OCEAN__的博客代码是由英语组成的，所以，学习编程，英语至关重要，并不是说英语不好编程能力就不行，英语不好的人编程能力牛逼的人大有人在。但是懂点还是好的吧，掌握的英语单词越多，开发效率会一定程度上有所提高的。 public...
不懂怎么转二进制编码 python
2023-03-13 16:41

回答 4 已采纳 a=int(input()) print('{0:8b},{0:8o},{0:8x}'.format(a))
在3个二进制数排序中，用gets()函数读取不到字符 c语言有问必答
2022-03-01 18:36

回答 2 已采纳 gets直接读入一行啊，你把三个数写在同一行，只有第一个gets执行了，后面两个gets还在等你输入而scanf是可以的，空格和换行符是字符串分割符，而gets只认换行符，不认空格的
c语言字符转化为二进制数 c语言有问必答
2021-11-17 17:11

回答 2 已采纳代码如下： #include <stdio.h> //char转2进制字符串 void char2bits(char ch) { char buf[10]; int i,t
编程新手导论
2012-06-07 20:00

wangluozhangleilei的博客 (要懂得一点思想具备一点常识)《设计，编码，，与软工》（编程与思想）这一章解释了三种思想，原语，抽象，组合，，和软件开发的二个重要过程，，软件工程的相关概念，是编程入门的关键 (要懂得一点领域内的数学)...
vscode，运行exe文件时提示"此文件是二进制或使用了不支持的文本编码" c语言有问必答
2021-06-06 23:09

回答 5 已采纳 exe可执行程序文件是C语言文件编译后最终执行的文件，无法用VSCode打开，题主需要编译文件的话，直接编译hello.c文件即可，exe文件是系统编译的文件，在运行hello.c时会自动运行hell
C# 二进制数据取反问题 c#
2015-02-02 03:50

回答 2 已采纳 string test="11111111" for (int i = 0; i < test.Length; i++) { Dat
golang有效的二进制编码
2016-03-25 19:29

回答 1 已采纳 encoding/binary.Write uses reflection, so it will be slower than anything that manually constructs
编程新手导论（转载）
2012-01-22 10:26

叶广明_微信ye_guangming的博客 (要懂得一点思想具备一点常识)《设计，编码，，与软工》（编程与思想）这一章解释了三种思想，原语，抽象，组合，，和软件开发的二个重要过程，，软件工程的相关概念，是编程入门的关键 (要懂得一点领域内的数学)...
Python中用于将字符串转换为二进制数据现在乱码；不知道怎么转换 python
2022-07-15 19:23

回答 2 已采纳 s1 = "今天的天气不错" s2 = ' '.join(format(ord(c), 'b') for c in s1) print("转换", s2)
工作中使用到的单词（软件开发）_2023_0316备份
2023-03-16 10:55

sun0322的博客目录■Java学习汇总■常用链接■2020/03/15 （最初...2021/01/01以降整理■2021/02/22以降整理■匿名内部类，lambda表达式，JDK7新特性，等等java相关■2021/03/18以降整理Linux系统性能相关■其他各种单词，知识（l
新手编程导论
2016-10-11 14:37

一个90后的成长史的博客眼前这本书充分体现了作者的所思、所想、所感，他用自己独特的眼光审视着计算机技术的世界，也用自己独特的思维逻辑对技术进行解读，并用自己特有的，呵呵，偶尔带有“四个逗号=一个逗号”这样的语言风格，进行着...
没有解决我的问题, 去提问

悬赏问题

¥60 求一个简单的网页(标签-安全|关键词-上传)
¥35 lstm时间序列共享单车预测，loss值优化，参数优化算法
¥15 基于卷积神经网络的声纹识别
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP

字符编码的相关知识联想到本地二进制代码困惑

1条回答 默认 最新

悬赏问题

1条回答默认最新