百科问答小站 logo
百科问答小站 font logo



Unicode 是不是只有两个字节,为什么能表示超过 65536 个字符? 第1页

  

user avatar   lianghai 网友的相关建议: 
      

Unicode 目前规划的总空间是17个平面(平面0至16),0x0000 至 0x10FFFF。每个平面有 65536 个码点。

你只是大致知道平面0(「Basic Multilingual Plane」,即「BMP」)的 65536 个码点(即 0x0000 至 0xFFFF)如何编码,这不是 Unicode 的全部。

  • BMP 的字符是 Unicode 中最基础和最常用的一部分,以 UTF-16 编码时使用2字节,以 UTF-8 编码时使用1至3字节。
  • 超出 BMP 的字符以 UTF-16 或 UTF-8 编码都需要4字节。
  • 另外还有一个比较少用的编码形式,UTF-32,它编码任何 Unicode 字符都需要4个字节。

Unicode 的基础是一个编号的字符集,在字符集之上又规定了模块化的编码等等技术层次,各种具体的编码形式并不一致,你说的「Unicode 只有两个字节」这句话根本不成立。

这种基础问题应当直接去看维基百科:

Unicode



  

相关话题

  计算机中为何不直接使用 UTF-8 编码进行存储而要使用 Unicode 再转换成 UTF-8 ? 
  为何微软不把 Windows 的默认字符集设置成 Unicode ? 
  最近微信里有一个戴辫子的表情是怎么做出来的? 
  如何看待现代中文输入过程中多错误使用√(平方根)作为✓(对钩符号)的替代? 
  除日本外汉字文化圈中其他地域是否存在「幽灵汉字」? 
  如何看待现代中文输入过程中多错误使用√(平方根)作为✓(对钩符号)的替代? 
  Unicode 字符集中有哪些神奇的字符? 
  怎样推动在 Unicode 标准中增加中国传统美食,比如包子、油条、春卷、烧卖、豆腐脑、火锅? 
  怎样推动在 Unicode 标准中增加中国传统美食,比如包子、油条、春卷、烧卖、豆腐脑、火锅? 
  Unicode 和 UTF-8 有什么区别? 

前一个讨论
微信为什么先于 Windows 版本推出微信 Mac 版客户端?
下一个讨论
有哪些以人物名字命名的食物?其中有什么典故?





© 2024-11-15 - tinynew.org. All Rights Reserved.
© 2024-11-15 - tinynew.org. 保留所有权利