百科问答小站 logo
百科问答小站 font logo



从uft8解码的乱码字符无法反推回原始二进制,如果让你改造utf8编码,你会如何解决这个缺陷? 第1页

  

user avatar   timothyqiu 网友的相关建议: 
      

这和 UTF-8 的编解码规则完全没有关系啊。

遇到不符合编码规则的无效二进制数据,到底是解码失败报错、替换成 U+FFFD 继续、还是跳过无效内容后继续,这是应用层面的异常处理。

这就像你去读一篇有生僻字的文章,不同人也有不同的处理方法:

孰謂鄹人之子知禮乎?
  • 小明直接「我不认识这个字。」
  • 小红读成「孰谓什么人之子知礼乎?」
  • 小强读成「孰谓,人之子知礼乎?」

你听完小红读的内容,就来知乎提问说「使用汉语读出的生僻字无法反推回汉字,如果让你改造汉语,你会如何解决这个缺陷?」理由是凡是生僻字都会被粗暴地读成「什么」。

贻笑大方。




  

相关话题

  计算机系统是如何显示一个字符的? 
  目前(2020 年)开发WINDOWS程序,用UNICODE还是多字节更实际? 
  计算机中为何不直接使用 UTF-8 编码进行存储而要使用 Unicode 再转换成 UTF-8 ? 
  QGraphicsRectItem子类无法接收mouseMoveEvent? 
  Unicode 和 UTF-8 有什么区别? 
  windows 的文本编码问题,什么时候能统一成utf-8? 
  Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别? 
  很多网站源码都是分为 GBK 和 UTF-8 版,为什么要同时开发两种? 
  为什么 UTF-8 编码比 UTF-16 编码应用更广泛? 
  为什么 UTF-8 编码比 UTF-16 编码应用更广泛? 

前一个讨论
光速飞船突然降低1%的速度,里面的乘客会因为惯性往前突然减速而摔成肉泥吗?
下一个讨论
《红楼梦》王熙凤不明确拒绝贾瑞,而是设计害死贾瑞,原因是什么?





© 2024-06-02 - tinynew.org. All Rights Reserved.
© 2024-06-02 - tinynew.org. 保留所有权利