扫码加入训练营

牢记核心词

学习得礼盒

2024考研计算机组成原理知识梳理:计算机编码集

2023-10-04 07:13:00来源:网络

  今天新东方在线考研频道小编为各位考生整理了“2024考研计算机组成原理知识梳理:计算机编码集”,相关内容。专业、实用的计算机考研复习备考内容,能使大家更有效率的掌握相关知识点,避免盲目学!更多计算机考研复习精彩内容,时刻关注新东方在线考研频道!

  2024考研计算机组成原理知识梳理:计算机编码集

  字符编码集的历史

  ASCII码

  对于ASCII码,相信大家在平时的学习、工作中都有所了解。

  ASCII码,英文全称为:American Standard Code for Information Interchange,翻译过来就是:美国信息交换标准代码,是我们平常常用的一种编码。那它是怎么来的呢?

  在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0),例如,像a、b、c、d这样的52个字母(包括大写)以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),假如,对于字符a,比尔盖茨想用0001来表示,而乔布斯想用0010来表示,那么他们在沟通交流的时候谁都无法理解对方的语言。因此,为了计算机能够互相通信而不造成混乱,就必须使用相同的编码规则,于是美国有关的标准化组织就出台了ASCII编码,统一规定了上述常用符号用哪些二进制数来表示。

  标准ASCII码也叫基础ASCII码,使用7个比特位来表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符,共定义了128(2的7次方)个字符。

  字符编码集的国际化

  随着计算机的进一步发展,越来越多的国家加入到了使用计算机的行列中,对字符编码集的要求也越来越高。对于欧洲、中亚、东亚、拉丁美洲等国家来说,它们的语言丰富多样,体系不一样,不以有限字符为组合,尤其以中国、韩国、日本等的语言最为复杂,ASCII码表根本无法表达这些语言,这就迫切需要使用新的编码集,也就是字符编码集的国际化。

  中文编码集

  GB2312

  GB2312是1980年制定的中国汉字编码国家标准,是我国最早最完备的一个编码集,一共收录了7445个字符,包括6763个汉字和682个其他字符,一个汉字占用两个字节。

  GBK

  由于GB2312不符合国际标准,中国的科学家在1995年推出了第二套完备的编码集——GBK,GBK向下兼容GB2312,向上支持国际ISO标准,收录了21003个汉字,支持全部中日韩汉字。

  GB2312和GBK都是比较完备的编码集,但是,它们只是一个本地化的编码,在中国使用是没问题的,但要跨国使用就有问题了。举个例子,一个中国人开发了一个网站,一个外国友人访问了这个网站,如果他们本地没有安装GB2312编码集或GBK编码集的话, 那么他们在访问网站网页的时候看到的会是乱码。因此,就需要一个全球统一的编码规范。

  Unicode

  为了统一所有文字的编码,Unicode应运而生。Unicode是一个兼容全球的字符集,定义了世界通用的符号集,可以表达全世界所有的文字和字符。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。

  我们平时用的UTF-8是其中一个编码规则,它以字节为单位对Unicode进行编码,平常写代码的时候都是推荐使用UTF-8编码。中文Windows操作系统默认使用GBK编码,因此,使用IDE编程时通常要设置成UTF-8编码。

  以上就是关于“2024考研计算机组成原理知识梳理:计算机编码集”的内容,更多计算机考研复习精彩内容,请持续关注新东方在线考研频道!


本文关键字: 考研计算机复习指导

考研英语核心词汇营

背词+听课+练习+督学,学习得礼盒

更多资料
更多>>
更多内容

关注新东方在线考研服务号

获得21考研真题及答案解析

1. 打开手机微信【扫一扫】,识别上方二维码;
2.点击【关注公众号】,获取资料大礼包。

近10年考研真题及答案免费下载
更多>>
更多公开课>>
更多>>
更多资料