具体如下图
浮点数表示法
如何表示文字其实表示文字和表示数字差不多 。直接上图,来点感性认识:
这是一个简单的字符打印小程序
这是一段很小的c程序,在这段程序里,97这个数字如果输出方式为数字,那它就是数字97,如果输出方式为字符,那么它就是英文小写字母a, 98这个数字代表着小写字母 b,在这段程序的眼中,字符和数字没什么不同,本质都还是数字,这种人为规定就将字母和数字联系了起来 。
由于早期的计算机基本都是在欧美或者是其他国家发明的,对于以英语为主的国家,所需要的字符量很少,阿拉伯数字,26个英文字母还有若干个标点符号就可以满足基本的日常需要,这样,把这种对应关系固定下来,就有了ASCII码表 。
美国标准信息交换代码是由美国国家标准学会(American National Standard Institute , ANSI )制定的,标准的单字节字符编码方案,用于基于文本的数据 。起始于50年代后期,在1967年定案 。它最初是美国国家标准,供不同计算机在相互通信时用作共同遵守的西文字符编码标准,它已被国际标准化组织(International Organization for Standardization, ISO)定为国际标准,称为ISO 646标准 。适用于所有拉丁文字字母 。
ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符 。标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符 。
——百度百科
ASCII码对照表
中国汉字的存储由于我们中国的汉字很特殊,每一个字都是唯一的,一般不能由其他字组合起来,不像英文单词是由26个字母拼合起来的 。因此,我们需要足够多的数字来一一对应汉字,因此一般汉字的存储需要两个字节,或者说一个字,也就是16比特,
16比特可以存储2^16次方 即 65536种信息 。并且我们有自己的编码规范 。
《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980 。1995年又颁布了《汉字编码扩展规范》(GBK) 。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20902字 。
随着要支持的汉字越来越多,还有适应社会的不断发展,我们国家的编码规范也在不断地更新完善 。
万国码随着世界各国的经济文化交流越来越紧密,各国国家不能固步自封,迫切地需要一种统一的计算机字符编码,这时,万国码(Unicode)出现了 。
万国码,万国码,通俗的讲就是全世界都通用的编码,它为了全世界通用,采用了一种非常简单的方法,就是将全世界所有的文字,符号都存放在一起 。
Unicode 是有两个字节、四字节之区分,UCS-4用4个字节编码,可表示2的32次方,即4294967296种字符 。
Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等 。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求 。
通用字符集(Universal Character Set, UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的标准字符集 。UCS-2用两个字节编码,UCS-4用4个字节编码 。
推荐阅读
- 水蛭能够钻入人的血管中吗
- 水蛭这么厉害它在人的肚子中可以存活吗
- 鱼塘里的蚂蟥怎么防治
- 不甜的食物就代表含糖量低吗
- 哪些食物不甜含糖量却高的吓人呢
- 明明吃的食物并不怎么甜怎么餐后血糖高
- 防晒霜和防晒喷雾的区别
- 椰果肉丸子的做法
- 和面时木薯粉与水的比例是51
- 西红柿炒蛋的做法