经验丰富的人有可能从文字乱码中直接读出信息吗？第1页

aee-ayu 网友的相关建议:

會熟悉一些亂碼特徵，會較快反應出來原本是哪種語言以及被錯誤地用哪種編碼。

比如看到全篇簡體字且有大量「酒」（아）「胶」（스）「父」（만）「捞」（이）等字的亂碼，可以確定是EUC-KR韓文被以GB顯示了。遇見大量半角片假名夾雜著少量複雜漢字的，基本可以確定是GB中文被以Shift_JIS顯示了。

我到現在還清楚地記得「酒福力胶」。

早期跨語言遊戲玩家對於經常看到的短語會記得一些常見的對應，但是主動去記憶它們的對應完全沒有必要，程序員更是不會做這種無意義的事兒，編碼轉換是常識。且GB若被以Shift_JIS顯示，因爲每個字符使用的字節數不同，兩者顯示出來的字符無法一一對應。

maigo 网友的相关建议:

现在的 CJK 文字一般都使用 UTF-8 编码了，所以乱码已经比较少见了。

二○○几年的时候，日文编码主要有两种：EUC 和 Shift-JIS，（简体）中文编码主要就是 GBK。

EUC 编码和 GBK 编码中，假名的编码是相同的，所以把 EUC 编码的日文按 GBK 编码打开，只有汉字会乱码。大概就是这个画风：

この坤であなたの唉を缄に掐れるもの
唾るライト斧つめて撕れない ahh 奇が豺けてゆく

矾はまだ悼うことなく
艇茫と钙べた泣」册ごし海もずっと

无あふれ贿まらなくて
己うことだけを兜えてゆくつもり

警しでも帕えたくて烬む看が
どんな沸赋してもやっぱり搪うのよ

この坤であなたの唉を缄に掐れるもの
唾るライト斧つめて撕れない ahh 奇が豺けてゆく

如果文本中汉字的密度不高的话，根据假名就能猜出不少汉字，就跟完形填空一样；常见的汉字见多了，就连猜也不用猜了。EUC 里的汉字是按音读顺序排列的，它们的编码对应着 GBK 的一级汉字区，这个区里的汉字是按拼音顺序排列的。当你记住了一些常用字的对应关系后，还可以用二分法猜测不常见的字。总体而言，熟练的人能看懂相当一部分。

而 Shift-JIS 编码中的假名，按 GBK 编码打开后，则会变成一大堆单人旁的生僻字：

偙偺悽偱偁側偨偺垽傪庤偵擖傟傞傕偺
梮傞儔僀僩尒偮傔偰朰傟側偄 ahh 撲偑夝偗偰備偔

孨偼傑偩媈偆偙偲側偔
桭払偲屇傋偨擔乆夁偛偟崱傕偢偭偲

椳偁傆傟巭傑傜側偔偰
幐偆偙偲偩偗傪嫵偊偰備偔偮傕傝

彮偟偱傕揱偊偨偔偰彎傓怱偑
偳傫側宱尡偟偰傕傗偭傁傝柪偆偺傛

偙偺悽偱偁側偨偺垽傪庤偵擖傟傞傕偺
梮傞儔僀僩尒偮傔偰朰傟側偄 ahh 撲偑夝偗偰備偔

看上去就有一种要晕的感觉，破解难度明显增加。不过，据说有些游戏玩家能背下来这些生僻字与假名的对应关系，这是真爱啊！

墙外的知友，可以来看 QuizKnock 的成员们人肉解读乱码：

经验丰富的人有可能从文字乱码中直接读出信息吗？的其他答案点击这里

前一个讨论

jQuery为什么还在发布新版本？

下一个讨论

面试官是怎么看出面试者不自信的？

经验丰富的人有可能从文字乱码中直接读出信息吗？第1页

相关话题

前一个讨论

下一个讨论

相关的话题

经验丰富的人有可能从文字乱码中直接读出信息吗？ 第1页

相关话题

前一个讨论

下一个讨论

相关的话题

经验丰富的人有可能从文字乱码中直接读出信息吗？第1页