这和 UTF-8 的编解码规则完全没有关系啊。
遇到不符合编码规则的无效二进制数据,到底是解码失败报错、替换成 U+FFFD 继续、还是跳过无效内容后继续,这是应用层面的异常处理。
这就像你去读一篇有生僻字的文章,不同人也有不同的处理方法:
孰謂鄹人之子知禮乎?
你听完小红读的内容,就来知乎提问说「使用汉语读出的生僻字无法反推回汉字,如果让你改造汉语,你会如何解决这个缺陷?」理由是凡是生僻字都会被粗暴地读成「什么」。
贻笑大方。