问题

信息熵极低的文字会是什么样子?信息熵极高的文字又是什么样子?

回答
信息熵是衡量信息不确定性或随机性的一个概念。在信息论中,信息熵越高,代表信息越随机、越不可预测;信息熵越低,代表信息越有序、越可预测。

下面我们从文字本身的角度,详细阐述信息熵极低和极高的文字会是什么样子:



信息熵极低的文字

信息熵极低的文字,意味着这些文字的信息含量非常少,并且高度可预测。它们通常具有以下特征:

1. 高度重复和模式化:

单调重复的字符或短语: 最极端的例子是只包含一个重复字符的文本,例如:“aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa”。这里的熵非常低,因为你知道下一个字符是什么,几乎毫无疑问。
简单、重复的短语或句子: 例如:“重复播放,重复播放,重复播放。” 或者“你好,你好,你好。” 这种文本的模式非常明显,很容易预测。
固定的、预设的格式: 比如一份标准的报告模板,其中大部分内容都是固定的标题、表格结构、说明文字等,只有少量的数据需要填写。例如:
```
报告标题:季度销售分析
部门:销售部
日期:2023年10月27日

一、 本季度销售概况:
总销售额:[填写数字]
销售增长率:[填写百分比]

二、 主要销售产品分析:
产品A:[填写数据]
产品B:[填写数据]

三、 总结与展望:
[填写总结]
[填写展望]
```
在这种文本中,大量的结构化文字都是预知的,只有方括号内的内容是变化的。

2. 低多样性:

词汇量极少: 文本中使用的词语种类非常有限。例如,一个只有几个词汇的简单指令集:“打开,关闭,开始,停止。”
语法结构简单且固定: 句子结构非常简单,甚至可以套用模板。
缺乏复杂信息或细节: 文本不会提供大量有区分度的数据或描述。

3. 强烈的可预测性:

基于上下文的强关联性: 文中的每一个字或词都与其前后的字词有极强的关联性,几乎可以一眼猜出下一个词会是什么。例如,在“1, 2, 3, ___”后面紧跟着“4”的概率极高。
已知主题或背景: 当我们知道文本的主题或背景时,其信息熵会进一步降低。比如,一份关于“如何组装家具”的说明书,即使内容本身有一些变化,但整体的流程和动作是高度可预测的。

4. 例子:

简单的指令或命令: “开始”,“停止”。
重复的口令或密码: “12345678”。
单调的音乐旋律: 一段只有几个音符重复的旋律。
机器生成的、没有经过训练的简单数据流: 例如,一个设备按照固定的时间间隔发送“OK”信号。
高度压缩但冗余的信息: 虽然压缩可以减少冗余,但如果压缩得过分,导致大量重复模式,其信息熵在原始信息层面来看可能很低。

信息熵极低的文字的“感觉”: 枯燥、单调、乏味、缺乏惊喜、一眼看到底。



信息熵极高的文字

信息熵极高的文字,意味着这些文字包含大量随机、不可预测的信息,每个字符或词语的出现都可能非常出乎意料,且相互之间的关联性非常弱。它们通常具有以下特征:

1. 高度随机和无模式:

随机生成的字符序列: 例如,纯粹随机生成的字母和数字组合:“kjf3h@z9p!qYv7rL2sMnbX5”。在这种文本中,下一个字符的出现与前一个字符之间没有明显的统计规律。
不可预测的词语组合: 即使是看起来有意义的词语,如果组合方式高度随机且无逻辑关联,也会产生高熵。例如,一个由随机选择的名词、动词、形容词随意堆砌而成的句子。
没有明显主题或逻辑结构: 文本内容跳跃性很大,前后文之间缺乏连贯性和逻辑关系。

2. 高多样性:

丰富的词汇量: 使用了大量不同的词语,每个词语出现的频率可能相对较低且分散。
复杂的语法结构: 句子结构多变,可能包含复杂的从句、修饰语,使得预测性降低。
包含大量独立且有区分度的信息: 每个部分的信息都可能提供全新的、与前文差异较大的内容。

3. 低可预测性:

上下文关联性弱: 文中的字词与前后文的关联性非常低,很难根据已知部分推断未知部分。
难以猜测后续内容: 即使读了一段,也无法准确预测下一句话会说什么,或者下个词是什么。

4. 例子:

加密后的密文: 经过良好加密的文本,其密文看起来就像随机的字符序列,每个字符的出现概率近似相等,且与明文信息之间没有直接的线性关系。例如,AES加密后的二进制数据以文本形式展示。
大量独立事件的记录: 比如一个记录了大量随机传感器读数的文件,每一行的数据都是相对独立的。
无意义的随机字符串: 用于测试系统处理能力、密码强度测试等场景。
高度模糊或抽象的艺术创作: 某些超现实主义的文本,其意象组合可能非常随机,挑战读者的传统认知和预测能力。
人类语言在特定场景下的极端表达: 例如,一群人在极其混乱、无序的语境下,各自说出互不相关的词语。

信息熵极高的文字的“感觉”: 杂乱、无章法、难以理解、充满未知、随机性强。



总结一下:

信息熵极低 的文字就像一段 简单、重复、有规律 的乐章,你可以轻易预测接下来的音符,感觉枯燥但易于理解(如果它有意义的话)。
信息熵极高 的文字就像一段 杂乱、无序、充满噪音 的声音,你无法从中辨别出任何模式或旋律,感觉混沌且难以捉摸。

在实际应用中,我们通常追求的是一种“适中”的信息熵。太低的信息熵意味着信息量少,效率低;太高的信息熵则可能导致难以理解和处理。人类语言的魅力就在于它在保持一定规律性的同时,又能通过丰富的词汇和多变的结构来传递复杂且新颖的信息,从而拥有一个相对较高的信息熵。

网友意见

user avatar

不玩梗,说个严肃的,俄语应该就算信息熵极低的语言,甚至比德语还低。

具体的请参考下面这个网站:

比较不同语言的信息熵,就要在表达意思相同的情况下,比较各语言所需的篇幅。而不同语言的联合国文件整好满足这一点,表达意思都是相同的,所以简洁度就能反映这个语言的信息熵。

我贴出的网址是今年第76届联合国大会上,秘书长关于联合国工作的报告,上面有联合国六大工作语言+德语(是这样的,德国在1973年加入联合国后,自费创办了德语翻译部,联合国文件都会被翻译成德语)。我整好下载了除阿语外所有语言的版本,各语言所需的页数如下:

中文24页,英语27页,西语27页,法语30页,德语30页,俄语37页。

可以看到,在篇幅长度这方面,俄语遥遥领先,中文果不其然最短;而令人惊讶的是存在大量合成词的德语,其篇幅长度居然和法语相当。可见在表达相同意思的条件下,俄语是最冗长繁杂的,而中文则是最简练的。

为什么德语有大量合成词却还是比俄语简洁呢?这主要是由于德语合成词放到其他语言中可以用词组来代替,所以该多长还多长;而俄语则不然,俄语单词是单纯的又臭又长,像大家津津乐道的“名胜古迹”这个词,这样的长单词在俄语中有很多。

你就从“联合国”在各种语言中的表达你就知道了。同样表达“联合国”这三个字的意思,德语是Vereinte Nationen,就两个不长不短的单词;而俄语则是Организация Объединённых Наций,意思是“国家联合组织”,这也看出了俄语是如何的冗长繁杂。

所以说信息熵极低的文字不用玩梗,俄语就是一个非常现实的例子。


没想到收到了这么多赞,那我就给大家举个直观的例子,来说明俄语的信息熵有多低吧。

这是我今天英语课上刚练完的六级汉译英真题:

北京大兴国际机场位于天安门广场以南46公里处,于2019年9月30日投入使用。该巨型工程于2014年开工建设,高峰时工地上有4万多工人。航站楼设计紧凑,可以允许最大数量的飞机直接停靠在最靠近航站楼中心的位置,这给乘客提供了极大的方便。航站楼共有82个登机口,但乘客通过安检后,只需不到8分钟就能抵达任何一个登机口。机场的设计可确保每小时300架次起降。机场年客运量2040年将达到1亿人次,有望成为世界上最繁忙的机场。

现在我用翻译软件将它翻译成俄语,大家可以看看有多长:

Пекинский международный аэропорт Дасин, расположенный в 46 км к югу от площади Тяньаньмэнь, вступил в строй 30 сентября 2019 года. В 2014 году началось строительство гигантского объекта, на котором работало более 40 тыс. Здание аэровокзала спроектировано компактно, что позволяет максимально возможному количеству самолётов заходить в непосредственной близости от центра аэровокзала, что очень удобно для пассажиров. В терминале имеется в общей сложности 82 посадочных пункта, однако пассажиры могут добраться до любого посадочного пункта менее чем через восемь минут после прохождения досмотра. Аэропорты спроектированы таким образом, чтобы обеспечить 300 вылетов в час. Количество пассажирских перевозок в аэропортах в 2040 году достигнет 100 млн. человек, и ожидается, что они станут самым загруженным аэропортом в мире.

由此可见,表达相同的意思,汉语非常简练,相比之下俄语就非常冗长繁杂,所以俄语真的是信息熵低的文字的典型代表。

user avatar

新水平、新境界、新举措、新发展、新突破、新成绩、新成效、新方法、新成果、新形势、新要求、新期待、新关系、新体制、新机制、新知识、新本领、新进展、新实践、新风貌、新事物、新高度, |

  重要性,紧迫性,自觉性、主动性、坚定性、民族性、时代性、实践性、针对性、全局性、前瞻性、战略性、积极性、创造性、长期性、复杂性、艰巨性、可讲性、鼓动性、计划性、敏锐性、有效性"

  法制化、规范化、制度化、程序化、集约化、正常化、有序化、智能化、优质化、常态化、科学化、年轻化、知识化、专业化、系统性、时效性

  热心、耐心、诚心、决心、红心、真心、公心、柔心、铁心、上心、用心、痛心、童心、好心、专心、坏心、爱心、良心、关心、核心、内心、外心、中心、忠心、衷心、甘心、攻心

  政治意识、 政权意识、大局意识、忧患意识、责任意识、法律意识、廉洁意识、学习意识、上进意识、管理意识

  出发点、切入点、落脚点、着眼点、结合点、关键点、着重点、着力点、根本点、支撑点

  活动力、控制力、影响力、创造力、凝聚力、战斗力

  找准出发点、把握切入点、明确落脚点、找准落脚点、抓住切入点、把握着重点、找准切入点、把握着力点、抓好落脚点

  必将激发巨大热情,凝聚无穷力量,催生丰硕成果,展现全新魅力。

  审判工作有新水平、队伍建设有新境界、廉政建设有新举措、自身建设有新发展、法院管理有新突破

  不动摇、不放弃、不改变、不妥协

  政治认同、理论认同、感情认同

  是历史的必然、现实的选择、未来的方向

  多层次、多方面、多途径

  要健全民主制度,丰富民主形式,拓宽民主渠道,依法实行民主选举、民主决策、民主管理、民主监督

  常用短语:

  立足当前,着眼长远,自觉按规律办事

  抓住机遇,应对挑战: 量力而行,尽力而为" 有重点,分步骤,全面推进,统筹兼顾,综合治理,融入全过程,贯穿各方面

  切实抓好,减轻,扎实推进,加快发展,持续增收,积极稳妥,落实,从严控制 严格执行,坚决制止,明确职责

  高举旗帜,坚定不移,牢牢把握,积极争取,深入开展,注重强化

  规范,改进,积极发展,努力建设,依法实行, 良性互动,优势互补,率先发展,互惠互利

  做深、做细、做实、做好

  全面分析,全面贯彻,持续推进,全面落实、实施,逐步扭转,基本形成,普遍增加,基本建立,更加完备(完善),明显提高(好转),进一步形成,不断加强(增效,深化),大幅提高,显著改善(增强),日趋完善,比较充分。

  常用排比句:

  以求真务实的态度,积极推进综合调研制度化。

  以为领导决策服务为目的,积极推进信息督查正常化。

  以体现办公室业务水平为责任,积极推进文秘工作程序化。

  以畅通安全为保障,积极推进机要、保密工作智能化。

  以立此存照为借鉴,积极推进档案、史志工作规范化。

  以解决问题为重点,积极推进信访工作有序化。

  以服务机关为宗旨,积极推进后勤服务优质化

  以统筹兼顾为重点,积极推进信息化、外事、侨务、法制工作常态化。

  以求真务实的态度,积极参与综合调研。

  以为领导决策服务为目的,把好信息督查关。

  以体现办公室业务水平为责任,进一步规范文秘工作。

  以畅通安全为保障,全力指导好机要保密工作。

  以立此存照为借鉴,协调推进档案史志工作。

  以安全稳定为基础,积极稳妥做好信访工作。

  以服务机关为宗旨,全面保障后勤服务。

  以整体推进为出发点,协调做好信息化、外事、侨务、法制工作。

  以周到服务为前提,对口支援前期筹备工作迅速到位。

  以提高服务水平为目标,宾馆和服务中心的改革开始推行。


  (一)求真务实,积极推进综合调研制度化

  (二)建立体系,积极推进信息督查正常化。

  (三)规范办文,积极推进文秘工作程序化。

  (四)各司其职,积极推进机要、保密、档案、史志、信访工作有序化。

  (五)注重质量,积极推进后勤服务规范化。

  (六)统筹兼顾,积极推进挂牌部门工作正常化。


  一是求真务实,抓好综合调研。

  二是提高质量,做好信息工作。

  三是紧跟进度,抓好督查工作。

  四是高效规范,抓好文秘工作。

  五是高度负责,做好机要保密工作。

  六是协调推进,做好档案、史志工作。

  七是积极稳妥,做好信访工作。

  八是严格要求,做好后勤服务工作。


  一、创思路,订制度,不断提高服务水平

  二、抓业务,重实效,开创办公室工作新局面


  一、着眼全局,充分发挥参谋助手作用

  二、明确分工,充分搞好统筹协调工作

  三、重协调,强进度,信息化工作有了新成果

  四、抓学习,重廉洁,自身素质取得新提高


  一、注重学习,自身素质取得新提高

  二、围绕中心,不断开创工作新局面


  1.着眼全局,做好辅政工作。

  2.高效规范,做好文秘工作。

  3.紧跟进度,做好督查工作。

  4.提高质量,做好信息工作。

  5.周密细致,做好综合协调工作。'

  6.协调推进,做好保密、档案、史志工作。


  一是建章立制,积极推进管理制度化。

  二是规范办文,积极推进工作程序化。

  三是建立体系,积极推进信息督查正常化。

  四是注重质量,积极推进会务工作规范化。

  五是各司其职,积极推进保密、档案、史志工作有序化。


  首先要树立正确的群众利益观,坚持把实现好、维护好、发展好最广大人民群众的根本利益作为促进社会和谐的出发点,在全社会形成和谐社会人人共享的生动局面。

  其次,是要树立正确的维护稳定观,坚持把确保稳定作为人民法院促进社会和谐的生命线。

  第三,是要树立正确的纠纷解决观,坚持把调判结合作为有效化解不和谐因素、增加和谐因素的有效途径。

  第四,是要树立正确的司法和谐观,最大限度地实现法律效果与社会效果的高度统一。



转载自:

user avatar

侯宝林大师,《深夜撒尿》

【北京话】

 “哟嗬!那屋‘咣当’一下子,黑更(jing)半夜,这是谁出来啦?一声不言语,怪吓人的!”

“啊,是我,您哪,哥哥,您还没歇着哪(睡觉的意思)?我出来撒泡尿。没有外人,您歇您的吧,您甭害怕,您哪。”

“黑更半夜的穿上点儿衣裳,要不然冻着可不是闹着玩儿的,明儿一发烧就得感冒喽。”

“不要紧的,哥哥,我这儿披着衣裳哪,撒完尿我赶紧就回去,您歇着您的吧,有什么话咱们明儿见吧,您哪。”

【山东话】

“这是谁?”

“这是我。”

“上哪去?”

“上便所。”

【上海话】

“啥人?”

“我呀。”

“啥体?”

“撒尿。”

【河南话】

“谁?”“我。”“咋?”“尿!”

user avatar

央视新闻的根基在基本方略

长期以来,我们在规模领域成绩斐然,功夫突飞猛进。然而央视新闻的发展并不像它表面那么光鲜,央视新闻问题依然突出。因此,必须正确认识能力,确保环节的实现。我们不仅要凝聚协调,汲取监控,理顺创新更要应对挑战。自兢兢业业以来,央视新闻问题就困扰着我们。央视新闻问题不仅极易造成完善问题,召开重要进展,维护基本经验,弘扬机制,而且可能引发活力危害,最终导致方针的后果。因此,我们必须走加强领导之路。求真务实,积极推进央视新闻工作制度化,建立体系,积极推进央视新闻工作正常化,规范办文,积极推进央视新闻工作程序化,强化责任,积极推进央视新闻工作有序化,注重质量,积极推进央视新闻服务规范化,统筹兼顾,积极推进央视新闻工作正常化。长期以来,央视新闻一直是竞争力老大难问题,从一定意义上讲,能否彻底解决央视新闻问题,关乎规范出发点,服务网络,统领模式,关乎激发主体,是积极争取的重中之重。因此,解决央视新闻问题,是基本形成之举。“求木之长者,必固其根本;欲流之远者,必浚其泉源;思国之安者,必积其德义。”孔子的话穿越历史的场合,到今天依旧振聋发聩,他不断警示我们央视新闻是我们关注的重点。央视新闻在秩序运行方面发挥了至关重要的作用,促进社会飞速发展,推动经济跨越进步,但是令人心痛的是,央视新闻也带来了一系列不容忽视的问题,如只注重了央视新闻的表面没有真正理解央视新闻的内涵,这造成了央视新闻永续发展的潜力损害,从这个意义上说正确使用央视新闻这把锋利的刀刃,助力央视新闻的全面合理运行显得尤为重要,因此,将央视新闻放在核心区位,置于首要地位,将是国家富强、民族振兴、人民幸福的根本之道。长期以来,我们在准则领域成绩斐然,网络突飞猛进。然而央视新闻的发展并不像它表面那么光鲜,央视新闻问题依然突出。因此,必须正确认识活力,确保管理的实现。我们不仅要鼓励建设,尊重准则,引导意识更要认清形势。


新时代来临,我们的央视新闻实现了历史性跨越式发展,秩序得到切实巩固和提高,亮点得到深刻变化;建议发展步伐加快;问题又快又好发展。目前我们已调控活力。但是我们也要清醒地认识到,核心的发展仍不能满足广大人民群众对于央视新闻的强烈需求,还不能适应构建和谐社会的迫切需要。央视新闻发展不平衡的问题突出,实施要素尚未取得根本性突破,重要进展改革需要深化,能力需要提高,针对性尚未得到很好解决。增长仍面临着新的机遇和挑战。总而言之,求真务实,积极推进央视新闻工作制度化,建立体系,积极推进央视新闻工作正常化,规范办文,积极推进央视新闻工作程序化,强化责任,积极推进央视新闻工作有序化,注重质量,积极推进央视新闻服务规范化,统筹兼顾,积极推进央视新闻工作正常化。有一个名为“蝴蝶效应”的理论:南美洲一只蝴蝶煽动翅膀有可能在一个月后的美国大陆形成一场龙卷风。它启示我们,小的、好的机制或事物应及时正确引导,为社会发展服务;小的、坏的机制或是事物应及时改正或是消除,避免危害社会。在 央视新闻领域, 格局只是一个微小的细节,然而他所带来的影响却是深远的。不仅会融洽行动,履行决策部署,排查力度,还会制约教育阵地。因此我们要推行落脚点,贯彻主旋律,总而言之,我们需要求真务实,抓好央视新闻调研工作,提高质量,做好央视新闻信息工作,紧跟进度,抓好央视新闻督查工作,高效规范,抓好央视新闻文秘工作,高度负责,做好央视新闻保密工作,协调推进,做好央视新闻档案工作,积极稳妥,做好央视新闻信访工作,严格要求,做好央视新闻服务工作。现在社会上央视新闻的这个领域出现了一系列问题。究其原因都在于环节这方面的事没做好。此问题如果不能得到重视,及时解决,将会影响提高情绪,加强主体,制约完善作用,保障政策,排查环境,甚至危害环节。央视新闻逐步的事件更是有利的印证。因此我们应该大幅提高。理思路,订制度,不断提高央视新闻服务新水平,抓业务,重实效,努力开创央视新闻工作新局面,重协调,强进度,尽快展现央视新闻工作新成果,抓学习,重廉洁,促进队伍央视新闻素质新提高。新时代来临,我们的央视新闻实现了历史性跨越式发展,倾向得到切实巩固和提高,信心得到深刻变化;重要进展发展步伐加快;局面又快又好发展。目前我们已取缔力量,创新支撑,建设意识,塑造倾向。但是我们也要清醒地认识到,传统的发展仍不能满足广大人民群众对于央视新闻的强烈需求,还不能适应构建和谐社会的迫切需要。央视新闻发展不平衡的问题突出,实施思想尚未取得根本性突破,安全改革需要深化,水平需要提高,实效尚未得到很好解决。项目仍面临着新的机遇和挑战。总而言之,求真务实,积极推进央视新闻工作制度化,建立体系,积极推进央视新闻工作正常化,规范办文,积极推进央视新闻工作程序化,强化责任,积极推进央视新闻工作有序化,注重质量,积极推进央视新闻服务规范化,统筹兼顾,积极推进央视新闻工作正常化。综观央视新闻发展史,各国都在不断改进拓展载体,推进建议,培育环境,在设想上,力求完善。以主导为例,为了央视新闻,巴拿马政府采取了集中精力的政策,使得。鲜明的案例告诉我们,要实现央视新闻的目的,必须在继承借鉴中发展最大限度,建章立制,积极推进央视新闻管理制度化,规范办文,积极推进央视新闻工作程序化,建立体系,积极推进央视新闻督查正常化,注重质量,积极推进央视新闻工作规范化,各司其职,积极推进央视新闻工作有序化。综观央视新闻发展史,各国都在不断改进分析有效性,在力量上,力求完善。以支撑为例,为了央视新闻,巴拿马政府采取了全面贯彻的政策,使得。鲜明的案例告诉我们,要实现央视新闻的目的,必须在继承借鉴中发展基层,建章立制,积极推进央视新闻管理制度化,规范办文,积极推进央视新闻工作程序化,建立体系,积极推进央视新闻督查正常化,注重质量,积极推进央视新闻工作规范化,各司其职,积极推进央视新闻工作有序化。综观央视新闻发展史,各国都在不断改进设置本领,巩固权威,尊重制度,研究总体布局,在形势上,力求完善。以科学性为例,为了央视新闻,巴拿马政府采取了更加完备的政策,使得。鲜明的案例告诉我们,要实现央视新闻的目的,必须在继承借鉴中发展特色,求真务实,抓好央视新闻调研工作,提高质量,做好央视新闻信息工作,紧跟进度,抓好央视新闻督查工作,高效规范,抓好央视新闻文秘工作,高度负责,做好央视新闻保密工作,协调推进,做好央视新闻档案工作,积极稳妥,做好央视新闻信访工作,严格要求,做好央视新闻服务工作。新时代来临,我们的央视新闻实现了历史性跨越式发展,工程得到切实巩固和提高,理想得到深刻变化;规划发展步伐加快;思想又快又好发展。目前我们已发扬内涵,确保内涵。但是我们也要清醒地认识到,利益的发展仍不能满足广大人民群众对于央视新闻的强烈需求,还不能适应构建和谐社会的迫切需要。央视新闻发展不平衡的问题突出,实施主意尚未取得根本性突破,需要改革需要深化,权威需要提高,载体尚未得到很好解决。方法仍面临着新的机遇和挑战。总而言之,求真务实,抓好央视新闻调研工作,提高质量,做好央视新闻信息工作,紧跟进度,抓好央视新闻督查工作,高效规范,抓好央视新闻文秘工作,高度负责,做好央视新闻保密工作,协调推进,做好央视新闻档案工作,积极稳妥,做好央视新闻信访工作,严格要求,做好央视新闻服务工作。子曰:“民惟邦本,本固邦宁。”形式的变化,环境的变化,群众的期待,都对央视新闻提出了新的要求和期许。如果能够意识到整治的重要性,就可以发挥其在前提的潜在价值,就可以发挥其在基本纲领的巨大作用。倘若不能体现能力,树立环节,取缔权威,那么就意味着不仅不能狠抓落实,而且不能全面推进,甚至会真抓实干拓进取。因此,央视新闻是现实之需,发展之要。子曾经曰过:“民惟邦本,本固邦宁。”,在人生阶段中,要规范敏锐性,合作信念,适应要素,适应网络在央视新闻这条奋斗之路上,开拓战略,拓展系统,创新速度是我们始终如一的追求。综观央视新闻发展史,各国都在不断改进取缔进展,检验结合点,加强体系,武装增量,在关系上,力求完善。以整治为例,为了央视新闻,巴拿马政府采取了各负其责的政策,使得。鲜明的案例告诉我们,要实现央视新闻的目的,必须在继承借鉴中发展出发点,以求真务实的态度,积极推进央视新闻工作制度化,以优化服务为目的,积极推进央视新闻工作正常化,以提质加速为责任,积极推进央视新闻工作程序化,以畅通安全为保障,积极推进央视新闻工作智能化,以立此存照为借鉴,积极推进央视新闻工作规范化,以解决问题为重点,积极推进央视新闻工作有序化,以服务机关为宗旨,积极推进央视新闻服务优质化,以统筹兼顾为重点,积极推进央视新闻工作常态化。现在社会上央视新闻的这个领域出现了一系列问题。究其原因都在于比重这方面的事没做好。此问题如果不能得到重视,及时解决,将会影响保护质量,强化环境,贯彻力气,倡导任务,制约促进质量,考验文件,鼓励支撑,整顿秩序,甚至危害能力。央视新闻唱响的事件更是有利的印证。因此我们应该积极争取。以求真务实的态度,积极推进央视新闻工作制度化,以优化服务为目的,积极推进央视新闻工作正常化,以提质加速为责任,积极推进央视新闻工作程序化,以畅通安全为保障,积极推进央视新闻工作智能化,以立此存照为借鉴,积极推进央视新闻工作规范化,以解决问题为重点,积极推进央视新闻工作有序化,以服务机关为宗旨,积极推进央视新闻服务优质化,以统筹兼顾为重点,积极推进央视新闻工作常态化。新时代来临,我们的央视新闻实现了历史性跨越式发展,机制得到切实巩固和提高,结合点得到深刻变化;方式发展步伐加快;精神又快又好发展。目前我们已推进水平,统筹基本经验,优化水平。但是我们也要清醒地认识到,主导的发展仍不能满足广大人民群众对于央视新闻的强烈需求,还不能适应构建和谐社会的迫切需要。央视新闻发展不平衡的问题突出,实施权威尚未取得根本性突破,关系改革需要深化,空间需要提高,作用尚未得到很好解决。基础仍面临着新的机遇和挑战。总而言之,求真务实,积极推进央视新闻工作制度化,建立体系,积极推进央视新闻工作正常化,规范办文,积极推进央视新闻工作程序化,强化责任,积极推进央视新闻工作有序化,注重质量,积极推进央视新闻服务规范化,统筹兼顾,积极推进央视新闻工作正常化。子曰:“民安土重迁,不可卒变,易以顺行,难以逆动。“形式的变化,环境的变化,群众的期待,都对央视新闻提出了新的要求和期许。如果能够意识到方案的重要性,就可以发挥其在准则的潜在价值,就可以发挥其在体系的巨大作用。倘若不能推行安全,包容作用,聚焦方式,解决认识,那么就意味着不仅不能逐步完善,而且不能严格执行,甚至会牢牢把握。因此,央视新闻是现实之需,发展之要。子曾经曰过:“为之于未有,治之于未乱。”,在人生阶段中,要倾斜质量,增强主导,保护信心,体现倾向在央视新闻这条奋斗之路上,统筹台阶,监督水平,说服准则是我们始终如一的追求。


从调节指南,形成措施,包容职能,到推进热点,细化渠道,转变工程,从借鉴问题,发扬文件,武装思想,筑牢网络,到汇集主体,从汇集秩序,到聚焦台阶,支撑素质,适应形势,强化重点,归结到一点上都是央视新闻。“治身莫先于孝,治国莫先于公。”,央视新闻绝非一朝一夕之事,只有紧紧抓住网络这个“牛鼻子”,久久为功,善始善终,方能推动台阶,为实现央视新闻贡献力量。当前社会现实中的央视新闻现象,既有要点的原因,也与亮点有直接关系。因此,解决央视新闻问题,既需要感召行动,完善动力,扩大职能,弘扬资源,也需要促进主体,发现重点,树立资源,扶持创新,更需要发扬力量,提出运行。只有这样,才能实现央视新闻目标。在未来的道路上,我们必须还会遇到这样那样的矛盾和问题,必须还会遇到这样那样的困难和险阻,面对来自各方的揣测和评议,面对来自各方的要求和呼声。惟有树立狠抓落实的理念,用积极稳妥去协调解决央视新闻,才能在央视新闻上取得突破,让央视新闻共同享有人生出彩,梦想成真的机会,实现央视新闻自由。“水有源,故其流不穷;木有根,故其生不穷。”对于央视新闻问题,需要我们发扬钉钉子的精神,一锤一锤敲下去,将工程干在实处,做到细处,落在深处。

补充信息熵极高的范例: @央视新闻

user avatar

谢邀。

这是个有趣的问题,要想给出正确的回答,就首先要明确一点:什么是信息熵?

为了照顾懒得到处翻问题的知友,我先简单给出如下定义:

信息熵可以认为是系统中所含有的平均信息量大小,也可以认为是描述一个系统需要的最小存储空间长度,即最少用多少个存储空间就可以描述这个系统。

热力学中的熵(Entropy)被用作系统无序程度的度量,而这一概念被香农(C.E.Shannon)引入到信息论中,并可以作如下量化:

值得一提的是,如果式中的是以2为底的,那么计算出来的信息熵单位即为“bit”,这一术语的也是Shannon在他的著名论文A Mathematical Theory of Communication(链接戳

bell-labs.com 的页面

)中首次正式使用的,其贡献不言而喻。

有了信息熵的定义,我们可以试着处理一些简单的事例。

就以英语为例。英语一共有23、啊不对26个字母,加上单词间的空格一共27个字符,构成取值的集合。如果这27个字符出现几率均等,我们取对数以2为底,可以计算出它的信息熵

而语言学家告诉我们英文的信息熵是4.03 bit ,这一数值要小于我们所计算的4.76 bit,原因就是有些字母常用而另外一些不常用。同时我们还可以看到,英文所传达的信息大概只均匀使用了个字母,也就是说如果可能的话其实英语只需要16个字母加空格就可以在最大程度上表达他们的信息了,而另外的10个字母则完全没有出现的必要。(这样一来TOEFL的难度是会增加还是降低呢?)

通过上面的讨论我们可以看到,信息熵所表征的是通讯中编码的码长的效率,是码长的节约或冗余,而非信息本身的节约或冗余。因此,任何一组字符集,在最有效使用的情况下,可以传达的信息量最大,等于。

那么问题来了:什么时候信息熵极低呢?

(我不是语言学工作者,而且见得也不多,以下内容纯属个人臆测)

单纯从信息熵的定义式出发,我们可以得到几个结论:

  • 这个式子是非负的。
  • 一个文字系统的n值越高,信息熵值也相应越大。

说到这想必大家可以隐约猜到答案了——只有一个字符的文字系统。

在这个系统下,它的,是信息熵最低的情况。

(为了便于讨论,我们不妨把它记为A。)

所以我们尽可以想象有这样一种文化,他们的子民间只用“A”这一个文字交流,这个字既包含了宇宙万物,却又什么也表达不了。每天从早说到晚只有这么一个字,谁也听不懂谁说了什么,谁也说不明白想要说的事。。。

这样的文字系统——显而易见,是注定出现不久就会被淘汰的。

========================================================================

正文部分结束,下面讨论一下评论中大家的观点,以及其他一些。。。

1.只用“A”也能组成各种含义,比如“AA”表示“你”,“AAA”表示“呱”。

我也考虑了这种情况,但就算通过不同数目∞的组合来表示不同含义,每个单独的含义间还是要有分隔符的,例如

  • AA / AAA / A / AA
  • AAA / A / AA / AA

这两种都是8个A,但内容肯定不同(姑且这么认为吧),所以这样一种文字系统已经不是单独的A构成,而是A分隔符两个字符所构成。

大概可以抽象视为“0”、“1”。

2.好多答案只是单纯在造句,你们这个样子是不行哒!

题主问题是

有没有比拼音文字的信息熵更低的文字呢?如果有,会是什么样子?

先不论题主对信息熵的概念理解如何,题目本身问的是另一种文字形式,再怎么用中文造句,中文的信息熵都是 9.65 bit。因而句子本身只能传达出说话人的语言表达能力如何,无法反应文字本身的信息熵。

3.不少人是Morse Code的拥趸,我们不妨估计一下这个系统的信息熵。

它包括5种代码(摘自wiki)

  • 点(.)
  • 划(-)
  • 每个字符间短的停顿(在点和划之间的停顿)
  • 每个词之间中等的停顿
  • 以及句子之间长的停顿

所以它的信息熵最大值,考虑到使用频率的不均等,我们最终可以认为Morse Code的信息熵在2左右。

BTW,二进制代码“0”“1”系统的信息熵,大家不妨自己一算。

user avatar

要用精炼的北京话,说这点儿事情,分成四句话,用十六个字就解决问题。 乙:一句话用四个字? 甲:哎。 乙:怎么说呢? 甲:那儿屋门一响,这儿发觉啦,一问:“这是谁呀?” 乙:四个字。 甲:回答也四个:“是我您哪。”“你干吗去?”“我撒泡尿。” 乙:哎!这个省事多啦。 甲:您听这个省事啊?还有比这省事的呢。 乙:哪儿的话? 甲:山东话。山东人要说这点儿事情,同是四句话,用十二个字就行啦。 乙:十二个字……噢!三个字一句啦? 甲:哎。 乙:怎么说呢? 甲:山东话啊。那儿屋门一响,这儿发觉一问:“这是谁?”(学山东话) 乙:嗯,三个字。 甲:回答也三个字:“这是我。”“上哪去?”“上便所。” 乙:嘿,这个更省事啦。 甲:不,还有比这省事的。 乙:哪儿的话? 甲:上海话。 乙:上海? 甲:上海人说话呀,八个字就够了。 乙:噢,两个字一句。 甲:哎。 乙:那怎么说呀? 甲:那儿屋门一响,这儿发觉一问:(学上海话)“啥人?”“我呀。”“啥去?”“撒尿。” 乙:嘿!这有点儿意思,省事多喽。 甲:不,还有比这省事的哪。 乙:还有比这省事的?哪儿的话? 甲:河南话。 乙:河南? 甲:哎,河南人说话,说这点事情,四个字就解决。 乙:一个字一句? 甲:哎, 乙:那怎么说? 甲:那儿屋门一响,这儿发觉一问:(学河南话)“谁?”“我。”“咋?”“溺!”

侯宝林——《戏剧与方言》

user avatar

下北泽语。

下北泽银民共和国(The Kizui Republic of Shimo Kitazawa)于1919年8月10日由时任日本陆军下等兵田所浩二建国,史称“先辈”(Senpai)。由于其雷厉风行的做事风格以及过人的计谋和积极赞赏认可他人的态度,又被誉为“野兽”(Beast)。建国初期,为了解决在当时日本帝国主义压迫之下国民普遍文化水平较低的问题,他指示文化部门加急出台一门普适性高、学习方便易于入门的应急语言,这便是下北泽语的前身,称为试用语(The trial phrases)。试用语一经出台便引发了全民的学习热潮,仅893天即在下北泽境内正式启用,后因该语在日常交流中并未引起太大的障碍,便成为了下北泽共和国的官方语言。

下北泽语是一门极具特色的语言,在世界范围内都显得格外特别——所有语句均用一套十分连贯的元音组成,语义仅通过声调变换以及断音断句和指示符号来区分。在用词方面,该语显得更特立独行:所有实义单词均由一个词根组成:a。而该语的整套语言体系也仅包含三个元音:yha、hay和a,当然它们的功能还是有很大的区别的。

yha为提气词(Holding breath word),由于下北泽人习惯于大声发音来强调情感(业界学者认为是受到了亚热带海季气候及当地文化的影响),语言习惯是使用连贯的发音,因此提气动作能够使声带预先震动,相当于一些人说话之前喜欢清嗓。yha一般用在正式交流前的铺垫,没有什么实义,但是是大多数非疑问句必须要添加的语素。

hay为语气助词(Modal particle word),与汉语一样只有在具体语境中才能体现其语用意义,并发挥交际功能。不过由于下北泽语语气助词仅能用hay来组合,而组合太长便失去了助词的作用,因此普遍不会使用过多。

a是组成下北泽语大多数实义句的成分(也是唯一可用的单词),名为词元(Lemmas word),并通过不同数量的组合拼接形成词伙。但仅仅是这样的话表达起来仍然显得复杂且不适用,因此在后期语言改革中句子新加入了声调符,来表示某一个长音中的声调变化,但仍然无法有效地解决结构单一冗杂,文字效率低下的问题。

然而,下北泽语的语法并不复杂,在几十年的改革后,一段日常用语并不会使用过多的字节,而加入了许多的简略语,并省去了诸多宾语,有时甚至不会加上主语——这导致大众的日常交流必须要在特殊的语境中进行。下面举一个例子:

中文:啊,来啊,打在胸上!

下北泽语:Yhā, hàyhày, Ǎáã ã ãã ã ā ã ã ãã â å Âàãã ã ã ā ã ãã ã ã ã ǎã ãã ā ãã ã ã ǎ å!

前面已经说过,yha和hay均为助词,因此不含有实际意义;整个下北泽语都会对音调有一个严格的区分,有低中高三个音域。其中,ǎ为去音,代表此时的“啊”音声调为低音域,与á放在一起表示了声调变化方向。ã指代的是一连串的过渡音,即一个音调的“爬坡”,同时数量的大小配合箭头表明了这句话的含义。这个句子经过中音域ā后进入了高音域â,并使用休止词å结束了一段实义句的内容,但在口语中无法表现出来(口语直接停顿),只用于书面。这段是“来啊”的意思;

同理,后两个å间内容为“打在胸上”。这句话是典型的主宾省略句,我们无法得知这句话的使用者让谁来,又是让什么打在谁的胸上。当然,这是下北泽语的典型使用情况,我们不是当事人无从得知详细内容。此外,野兽先辈的名言“这个可以有!”同样也未表明主宾(“这个”在下北泽语中并没有词表示,为求易于理解加入了汉语语境的“这个”)。整段话需要约9秒才能完成,而同义的汉语需要3秒,英语仅需要2秒即可表达出这句话。

下北泽的语言复杂且用词繁复,而又因为其低严谨性与低效率,以下北泽语制定的法律出现过很多意义不明的漏洞。尽管政府一直在努力完善下北泽语词条,以至于目前在某些专业论文中一度使用了将近810个a来表达一个单句,而日常用词词汇库更达到了惊人的114514个(英语日常使用的单词量仅为3000~5000),但效果甚微。

2001年,下北泽语被联合国教科文组织列入了“世界低信息熵语言”名录。同年,英国BBC电视台与日本纪录片公司COAT CORPORATION合拍了大型语言文化采访纪录片《仲夏夜之语言》(日语:真夏の夜の言語,英语:A Midsummer Night's Language),该片详细阐述了下北泽语的发展历程与文化背景,在Youtube和N站都有相关视频,但国内B站等平台还没有引进。专家们普遍认为,这是下北泽文化兴起的开始。

近几年来,随着网络文化的兴起,陈旧的下北泽语又有了新的生机。由日本网友自发组织的下北泽文化运动正在不断扩大,出现了许多有关下北泽语以及下北泽共和国和其创始领袖田所先辈的视频,这个不为人知的小国正在走进世界人民的视野中。对此,下北泽政府并没有对此发表态度,但也未阻止某些略微极端的群体的行为和其创作作品的传播。尽管下北泽语的前景总体不太乐观,但如果能够积极吸纳外来语的特点并持续优化结构体系,相信它会有绽放语言文化光辉的那一天。


由于一般通过过多,光加一个虚构标记看来事不够的(悲),还是解释一下吧

诚然下北泽语源远流长(指文章长度),unfortunately它仍然是一门虚构的语言,并不存在现实之中。而下北泽是一个位于日本东京都世田谷区的地区,和秋叶原一样是去时装、饰品购物的好地方。不过近几年来因为淫梦文化的影响,本身开始有了恶臭的意味(悲),但还是希望大家能够分清现实与网络文化,并时刻记得自行去查证信息的真伪,避免被误导或者带节奏。对于恶臭文化感兴趣的同学可以自行去了解,这里就不再说了(这么臭的梗实在没必要去了解就事了)

恶臭链接:



user avatar

知乎首答,刚好今天接触了下信息熵,就在这说一下自己对 语言中信息熵 的理解(如有错误,还请海涵并指正)


----------------------------

歧义、冗余度、利用率、效率四个方面分别对信息熵高和低的语言进行简述。


某系统的符号平均符号信息表达量(信息熵)简记为 Entropy。

1、Entropy越高,表达一条信息,所用的平均符号数就越少,整个句子越言简意赅。其中每个符号歧义低冗余度低利用率低效率高。若世界上信息数一共有A个那么多,每个符号的冗余数为m,理论上就要A/m个符号,每个符号的利用率就是m/A。

2、Entropy越低,表达一条信息,所用的平均符号数就越多,整个句子相应啰嗦。其中每个符号歧义高冗余度高利用率高效率低。若世界上信息数一共有B个那么多,每个符号的冗余数为n,理论上就要B/n个符号,每个符号的利用率就是n/B。。


显然 A == B, m < n。
所以

信息熵越高,符号量越多,每个符号的利用率越低,重在去学习哪些符号与哪些信息相对应。


信息熵越低,符号量越少,每个符号的利用率越高,重在学习符号怎么去组合使用来表达信息,组合的存在使得信息表达的时候显得符号冗余。


----------------------------

这里不严谨地举个例子:表达两个意思,比如“你去哪”、“来这”。

因为汉语的信息熵高,分别用“你去哪”、“来这”就能表达了。可以看到每个意思里面都只有两三个符号,言简意赅,效率又高(每个字就用了一次便表达出来意思),虽然在这几个字上体现不出来利用率,但是像“卌(xi 四声)”这种字,显然用到的地方很少,利用率低,不过反过来,它表示“四十”的意思,信息量很大。

因为英语的信息熵低,分别用“Where are you going”、“Come here”表达。可以看到是冗余了不少,单个e o字母就用了多次,效率显得也低(用了好多次才表达出来),但是它的利用率却很高,身为26个字母中的一员,在这个很普遍的地方就出现了好几次。


所以翻译过来的书一般都比原来的英语原版的薄(只要你字体扩大的别那么夸张,如果汉字大小和字母大小一样大,那更薄...)


----------------------------

而信息熵对应的刚好又是计算机里面的符号表达所需的平均bit理论最低数,你觉得言简意赅,计算机仍要用复杂的来表示,毕竟1bit代表的意义永远是0或1。到了计算机里面,表达同种意义的所有语言都将被平等对待,语言不同,其bit占用数又会出现不同。而每个语言的理论bit数,也是压缩软件努力追求的理想目标。


---------------------------

最后再举个哈夫曼树,为了空间最优,频率(利用率)越低的、对应信息量也越大的字母,占用bit数也越多,可见这个优化算法在不知不觉中遵循着信息熵理论。

---------------------------

如果我说的讲的比较明白,楼主应该就能想象信息熵极低的文字是什么样子的了。

2016-5-30更:更改错别字,简化内容。

user avatar

我们有些同志欢喜写长文章,但是没有什么内容,真是“懒婆娘的裹脚,又长又臭”。为什么一定要写得那么长,又那么空空洞洞的呢?只有一种解释,就是下决心不要群众看。因为长而且空,群众见了就摇头,哪里还肯看下去呢?只好去欺负幼稚的人,在他们中间散布坏影响,造成坏习惯。

——毛泽东《反对党八股》

user avatar

信息熵极低的文字是什么样子?

今天小编就来帮助大家了解一下信息熵极低的文字到底是什么样子。

所谓信息熵极低的文字,它肯定是一种文字,只不过它的信息熵非常低。而这种文字的样子,肯定看起来信息熵极低!

好了,以上就是信息熵极低的文字的样子。看完你有什么看法么?留言评论区你认为的信息熵极低的文字是什么样子吧!

user avatar

极低的有政治学大佬回答了。我就来个极高的:

你女朋友背着我偷吃。

user avatar

说一个文字极其简洁,但信息量丰富的例子,出自孔子的《春秋》:

郑伯克段于鄢。

整件事描述只有六个字,郑伯和段是人物,克是行为,鄢是地点。这么看起来平淡无奇的几个字,很多人看一眼就过去了。然而一些学者并不这么认为,他们认为每个字都有巨大的信息量。《春秋》偏偏就是一本这么简洁的书,于是他们特地写了几本书来解释它。


比如《春秋谷梁传》:

克者何?能也。何能也?能杀也。何以不言杀?见段之有徒众也。
段,郑伯弟也。何以知其为弟也?杀世子、母弟目君,以其目君知其为弟也。段,弟也,而弗谓弟;公子也,而弗谓公子。贬之也。段失子弟之道矣,贱段而甚郑伯也。何甚乎郑伯?甚郑伯之处心积虑成于杀也。
于鄢,远也,犹曰取之其母之怀之云尔,甚之也。
然则为郑伯者,宜奈何?缓追,逸贼,亲亲之道也。

这位作者认为用“克”字不用“杀”,表明是战争中击败了对方的军队。段其实是郑伯的弟弟,但不说弟或公子,因为段没有做到一个弟弟应有的德行。而鄢是个离郑国中心比较远的地方,说明是郑伯处心积虑,先放跑了段,然后又前去击败了段。

也就是说,这六个字其实描绘了一段关于兄弟反目的惊心动魄的阴谋。


另一本《春秋公羊传》也给了自己的解释,与《春秋谷梁传》类似:

夏五月,郑伯克段于鄢。克之者何?杀之也。杀之则曷为谓之克?大郑伯之恶也。曷为大郑伯之恶?母欲立之,己杀之,如勿与而已矣。段者何?郑伯之弟也。何以不称弟?当国也。其地何?当国也。齐人杀无知何以不地?在内也。在内虽当国不地也,不当国虽在外亦不地也。

这段文字提到,用“克”字不用“杀”,是为了强调郑伯的恶。还提到是母亲想要立弟弟段,而郑伯先给他封了土地,又杀了他。于是出现了第三个角色,两人的母亲。


尽管上面两段文字都有对文字的解释,相信很多人都还是看得一头雾水。其实,还有一部解释更为详细的著作,并且很可能掺杂了很多想象,以至于让事件看上去像一篇绘声绘色的小说。这个作者是个盲人,叫左丘明,著作叫《春秋左氏传》:

初,郑武公娶于申,曰武姜。生庄公及共叔段。庄公寤生,惊姜氏,故名曰“寤生”,遂恶之。爱共叔段,欲立之,亟请于武公,公弗许。及庄公即位,为之请制。公曰:“制,岩邑也,虢叔死焉,佗邑唯命。”请京,使居之,谓之“京城大叔”。
祭仲曰:“都,城过百雉,国之害也。先王之制:大都,不过参国之一;中,五之一;小,九之一。今京不度,非制也,君将不堪。”公曰:“姜氏欲之,焉辟害?”对曰:“姜氏何厌之有?不如早为之所,无使滋蔓。蔓,难图也。蔓草犹不可除,况君之宠弟乎?”公曰:“多行不义,必自毙,子姑待之。”
既而大叔命西鄙、北鄙贰于己。公子吕曰:“国不堪贰,君将若之何?欲与大叔,臣请事之;若弗与,则请除之,无生民心。”公曰:“无庸,将自及。”大叔又收贰以为己邑,至于廪延。子封曰:“可矣。厚将得众。”公曰:“不义不昵,厚将崩。”
大叔完聚,缮甲兵,具卒乘,将袭郑。夫人将启之。公闻其期,曰:“可矣!”命子封帅车二百乘以伐京。京叛大叔段。段入于鄢。公伐诸鄢。五月辛丑,大叔出奔共。
遂置姜氏于城颍,而誓之曰:“不及黄泉,无相见也。”既而悔之。
颍考叔为颍谷封人,闻之,有献于公。公赐之食。食舍肉。公问之,对曰:“小人有母,皆尝小人之食矣,未尝君之羹。请以遗之。”公曰:“尔有母遗,繄我独无!”颖考叔曰:“敢问何谓也?”公语之故,且告之悔。对曰:“君何患焉?若阙地及泉,隧而相见,其谁曰不然?”公从之。公入而赋:“大隧之中,其乐也融融!”姜出而赋:“大隧之外,其乐也洩洩!”遂为母子如初。
君子曰:“颖考叔,纯孝也。爱其母,施及庄公。《诗》曰:‘孝子不匮,永锡尔类。’其是之谓乎?”

相信很多人已经在语文书中读到过这篇文章。它对整个事情有了详尽的说明,即两人的母亲武姜因为郑庄公难产而讨厌他,而偏心于他弟弟段,以至于多次跟郑武公说改立段为继承人,但武公没同意。后来庄公即位,在母亲请求下,将段封到了一个还不错的地方。段心有不满,搞小动作,大臣于是劝庄公早点灭了段。庄公却说咱们不急,要让他“多行不义必自毙”。在表面的忍让下,段更加胡作非为,在作死的路上越走越远,甚至发起武装叛乱。庄公早有准备,在鄢轻松击败了段。另一方面,他发誓除非下黄泉,绝不和母亲相见。但转眼就表示真香,和母亲在隧道里冰释前嫌。活脱脱一出峰回路转而感人肺腑的故事情节。


这样,整件事背后的权谋就很清楚了。如果庄公直接搞弟弟,大家会觉得庄公无情,母亲那边也说不过去。然而他下了个套,既能完全灭了段,又不会让自己的势力和名声受损。贪心又傻乎乎的段果然钻进去了。在外人看来,情况就变成了:“哎呀弟弟,我明明对你这么好,你为什么非要这样作死逼我搞你”。

当然,对于这些,孔子等史家都清楚地看在眼里。“郑伯克段于鄢”这六个字可谓精准地概括了整件事情。《左传》里说的是郑庄公,但孔子故意说郑伯,按照“公侯伯子男”的顺序,可能还是对他的鄙视。(此处有争议,我是查阅过一定资料,有学者这么认为,所以这么写,不代表事实如此。如果有不同意见,你是对的。)

因为儒家讲究的是“孝悌”的家庭伦理道德,后世史家也对于郑庄公的这个做法持否定态度。他们认为作为兄长,应该对亲弟弟团结和规劝。历史上因为权力斗争,兄弟相残的故事也并不少。


于是大家明白了,这正是《春秋》的风格,微言大义。短短的几个字暗含了对事件的叙述和作者的褒贬态度,每一个字都极其谨慎,所以有“孔子作春秋,而乱臣贼子惧”的说法。这种写法后来被称作“春秋笔法”。当然,现在这种寥寥几个字但信息量巨大的文字已经基本见不到了。

user avatar

不妨让我们从汉字开始,一步步找到一种信息熵最小的符号表达系统

首先要明确题主的问题,根据描述以及描述中给出的相关问题,我对这个问题的理解是:能否找到这样一套文字系统(符号系统),使得和其他符号系统相比,要想表达相同的含义,这套符号系统所需要用到的符号个数最多。

然后再来明确一下信息熵,这一点我认为

@铜锈锈

已经解释得很好了,这也是我这个答案中唯一用到的公式,我也会尽量用通俗的语言说明它。

关于这个公式的说明(不想看或者看不懂可以跳):

H(x)为信息熵,我们的目的就是让它尽可能小;

n为这一套符号系统中拥有的符号种类的数量,例如对于英语来说,忽略大小写的话(大小写不太影响表意),每个字符可能为a,b,…,z以及空格,至少27个字符,所以英文的n为27。如果要考虑标点符号的话,n可以取得更大一些;

表示这是第i个字符,例如我们可以规定为‘a’,为'b’等等…当然也可以换个顺序,不过不会影响熵的计算结果;

则表示该符号出现的概率,还拿英语举例子,'e'这个字符明显要比'v'出现的多得多,所以对应的概率也会大一些;

b是对数的底数,可以简单理解为得出的这个熵的量纲,取多少不本质,一般取2。


那么要想让熵小的话,需要什么呢?根据这一个公式,得出的结论是有如下方法:

方法一:符号种类数量越小,信息熵越小
方法二:各符号出现的概率越不均等,信息熵越小

=============================================================

OK,我们现在开始寻找一种信息熵极低的符号系统。

首先,对于汉字来说,符号种类即汉字个数,我们光常用字就三千多个,这是在是太大了,难怪汉字言简意赅。

不行,我们需要一个n更小的符号系统。

于是我们把n逐渐减小,寻找到了韩文、日文……英文。这时已经只有27个符号了。然后我们发现英文果然比中文啰嗦了很多。。。

既然n越小熵越小,那我们不如一步到底吧!!

好,那我们让n=0

我们得到了一个没有任何符号的符号系统。

坑爹呢这是!!!!

既然零不行,那么我们让n=1。于是我们得到了一种新的文字系统,这种文字系统只有一种文字,简直碉堡了!接下来让我们用这种文字讲一个故事:

嗯,果然很长。

可是这真的可以吗?如果我们把n=1代入到公式中,会发现其实H=0,也就是说这种文字系统无法携带任何信息。因为不管什么信息用它表示出来都是这一种符号。(也许有人会说烫的个数可以用来表达,其实并不能,详见n=2)

那么我们再让n=2。

好,我们拥有了两个字符:”烫“和”屯“。

显然n=2是可以的,因为把摩斯电码写下来就是一种n=2的文字系统。或者我们可以把空格到z编号为0到26,用他们的5位二进制来表示。如a为烫烫烫烫屯,k为烫屯屯烫烫,……


=============================================================

好,我们已经把n压缩到极限了,方法一不再能使用,接下来只能从方法二继续下手了。

方法二:各符号出现的概率越不均等,信息熵越小

现在我们的语言有两个字符,而且出现的概率相差并不多,考虑到从27到31我们没有编码,和字母本身出现的概率不均匀,可能”烫“比”屯“出现的概率要略微大一些。

不行,两个概率还是太接近了,不如我们让1出现的概率为0吧!!



看来不能为0,那么就让其中一个符号出现的概率非常接近0,另外一个非常接近1不就行了?

没错!现在我们假想这样一种语言,它拥有两个符号:”烫“和”屯“,但表示0到26的不再是二进制编码,而是两个”屯“之间”烫“的个数。这也是n=1的情况不行的原因,因为在”烫“之间必须要有其他什么东西进行划分,才能让我们分清楚究竟有几个”烫“。

所以bad这个单词可以写成001010000(我还是用0和1吧…),而且我还可以用这种文字写出更长的话:

000000000000000010000000000001000001010000000000000000000100000110001000000000000100000000010001000000000001101000000010000000000000000001000001000001

嗯,果然又长了。

=============================================================

接下来让我们来比较一下这些语言

中文:你好(2个符号)

英文:hello(5个符号)

二进制1.0版:01000 00000 01100 01100 01111(25个符号,注:空格仅为看得清楚,实际上并无空格)

二进制2.0版:00000000100000100000000000010000000000001000000000000000(50个符号)

我们已经把两个符号就能表示清楚的意思变成了50个符号才可以表示了!如果继续让1出现的概率更小的话,这个值还可以提高!

=============================================================

那么,还可以从其他方面继续改进吗?

我们还可以引入冗余

通俗来说,冗余就是一些并无意义的编码。例如对于二进制2.0版,我们可以规定隔开那些0的不是1个1,而是10个1,这样的话,诸如001010000这种序列就不再有实际含义,相当于一个本来能表示某种含义的序列被浪费了,所以要表示同样多的含义就需要更多的符号。

这样即使1的概率变得比之前都要高,即使bad这样一个简单的词,都会变成:001111111111011111111110000(27个符号)。。。如果把10个1改成1000个1就更多了,这种冗余的引入其实可以说是无穷无尽的,要多少有多少!!0000011111111110000000000000000000000001111111111000111111111100000000011111111110000000000000000000011111111110000011111111110000!!!!!

user avatar

领导的讲话。

你浪费了一分钟,就浪费了六十秒。

门外有两棵树,一课是枣树,另一棵也是枣树。

听君一席话,如听一席话。

一日不见,如隔一日。

这么晚还没睡的人应该都还没睡吧。

七日不见,如隔一周。

但凡你这话有点道理,也不至于一点道理也没有。

剥开香蕉后,你会发现一个剥了皮的香蕉。

总而言之,这个事就是这么个情况,具体的大家也都看得到。因为啊,这件事上面有个问题,所以你可能听的不是很明白。但是意思就是这么个意思。至于这件事到底怎么了你不要去猜,这种事情见得多了,我只能说懂得都懂。不懂的也不用多解释,毕竟自己知道就好,细细品吧。

小张上次来华盛顿的时候,还是在上一次。据统计,华盛顿100%的留学生都在华盛顿上学。谁能想到,25岁的小张三年前刚来华盛顿的时候只有22岁。小张做了一场半小时的 presentation,整整用了30分钟。小张上午去 Dunkin 买了两杯冰咖啡,一杯是冰的,另一杯也是冰的。谁能想到,绿线在开得不慢的时候,还是开得挺快的。华盛顿的堵车有多堵车,就是这么堵车。当你在93上堵了60秒,你的生命就流逝了一分钟。华盛顿大学的物理学教授竟然教了一整节课的物理。华盛顿冬天下大雪的时候,没有一片雪花是不下的。如果华盛顿不是那么冷的话,还是挺热的。据统计,每一个从哈佛毕业的学生,都毕业于哈佛。据统计,MIT数学系的学霸,数学成绩都特别好。据统计,华盛顿的第一高楼,竟然比第二高楼要高。据统计,每三个华盛顿人,都有三个人。

下面来看看信息熵高的

今日份仙女营业啦 无语子 今天去买奶茶鸭 救命 我真的哭死 呜呜呜这家店的奶茶真是yyds 啊啊啊啊啊啊蛋糕也是绝绝子鸭 我暴风吸入 好喝到跺jiojio 路上还看见一个普信男 真下头 不管啦 今天跟集美也是在逃公主的一天 好想谈一场双向奔赴的恋爱呜呜呜今天跟集美出去逛街啦,搞点神仙甜品778顺便暴风吸入好喝到剁jiojio的加芋圆加布丁加椰果加芋泥加奥奥碎加脆啵啵加奶盖加花生加燕麦加红豆加砒霜的奶茶最后缓缓口服一片v商购入的三无控糖片,还点了茶百道的分装做了个隐藏甜品吃,茶百道yyds,小狗勾暴风吸入隐藏甜品后好吃到翘jiojio,真的绝绝子 ~还点了茶百道的分装做了个隐藏甜品吃 真的绝绝子啊!!茶百道的分装就是yyds 今天跟集美也是在逃公主的一天 害,明天又得回学校啦好烦啊感觉我的室友们都好土 连live house是什么都不知道也不听落日飞车 不说了,明天又是干饭人干饭魂的一天,集美我在快乐星球得了那个大病,但是我不治,诶就是玩儿,真是绝绝子 ,你寄吧谁啊?这里都是快乐星球的凡尔赛人,你是什么牛马,这里有个人夺笋,但我不说是谁,因为他夺了,但也没完全夺。乌鸡哥乌鸡哥yyds,不传谣,不信谣,坐等团团反转。哦哦哦哦哦哦哦哦!。急了急了,勇敢牛牛不怕困难。危险⚠️!危险⚠️!危险⚠️!好久不见终于等到你出现~雨下整夜eieieieieieieieieieieieieieiei哥们我一直稳定发力⚡⚡⚡这几年犀利又糊涂起起又伏伏感觉像在冲浪 拉长耳朵 提高警觉⚠️ 神经细胞 全面戒备 ‍♀️你的电话☎️绝不漏接 晕啊晕啊晕 危险⚠️!危险⚠️!危险⚠️!好久不见终于等到你出现~雨下整夜eieieieieieieieieieieieieieiei哥们我一直稳定发力⚡⚡⚡这几年犀利又糊涂起起又伏伏感觉像在冲浪 拉长耳朵 提高警觉⚠️ 神经细胞 全面戒备 ‍♀️你的电话☎️绝不漏接 晕啊晕啊晕 危险⚠️!危险⚠️!危险⚠️!好久不见终于等到你出现~雨下整夜eieieieieieieieieieieieieieiei哥们我一直稳定发力⚡⚡⚡这几年犀利又糊涂起起又伏伏感觉像在冲浪 拉长耳朵 提高警觉⚠️ 神经细胞 全面戒备 ‍♀️你的电话☎️绝不漏接 晕啊晕啊晕​

再来个信息量很大的:

床上有两个枕头,一个是我的,另一个是隔壁老王的。

类似的话题

  • 回答
    信息熵是衡量信息不确定性或随机性的一个概念。在信息论中,信息熵越高,代表信息越随机、越不可预测;信息熵越低,代表信息越有序、越可预测。下面我们从文字本身的角度,详细阐述信息熵极低和极高的文字会是什么样子: 信息熵极低的文字信息熵极低的文字,意味着这些文字的信息含量非常少,并且高度可预测。它们通常具有.............
  • 回答
    的确,在常人看来,间谍生涯无疑是行走在刀尖上的买卖,不仅风险大到“生死簿上名字不定哪天就会被勾掉”,而且其行为本身也常常与“盗窃”、“侵犯国家利益”、“违法缺德”等词汇挂钩。那么,究竟是什么样的力量,能够驱动一些人甘冒如此巨大的风险,踏入这片常人避之不及的灰色地带呢?抛开那些被影视剧过度浪漫化的成分.............
  • 回答
    你这个问题很有意思,它触及了生物技术和信息存储领域的前沿思考。想象一下,我们能否将生命本身变成一个活的U盘,把重要的信息“写入”到像蟑螂或者水熊虫这样生命力顽强的生物体里,然后让它们在极端环境下繁衍生息,等需要的时候再把信息“读”出来?从理论上讲,这并非完全没有可能,但实际操作起来却异常困难,可以说.............
  • 回答
    说实话,最近围绕那位特斯拉车主维权的事情,确实把不少人的目光都吸引过去了。从一开始的慷慨激昂到后续一系列的发酵,其结果究竟如何,现在还很难下定论。但如果事态最终发展成一场“闹剧”,那对我们一直强调的“营商环境”和“投资信心”带来的影响,绝对不能掉以轻心,而且很可能是相当深远的。咱们先掰扯掰扯“营商环.............
  • 回答
    这可真是个有意思的问题!《极限挑战》里的“猪”和“磊落”、“菠萝”之间的信任关系,其实是节目效果、人物性格以及他们之间不断演变的关系综合作用的结果。要说小猪(罗志祥)为什么会对“磊落”组合(黄磊、黄渤)不那么信任,反而对“菠萝”组合(王迅、张艺兴)有更多依赖,咱们得好好掰扯掰扯。首先,得从“磊落”组.............
  • 回答
    《刺客信条:英灵殿》这款游戏,表面上看是一部充满北欧神话色彩的维京史诗,但深入挖掘其中,你会发现一些令人不寒而栗的细节,它们巧妙地融入游戏叙事、角色塑造乃至世界观之中,如果你不仔细留意,很容易错过,但一旦品味,便会让你对游戏产生更深层次的恐惧和思考。1. 血脉的诅咒:西格德与艾沃尔的命运纠缠西格德作.............
  • 回答
    《信条》这部电影,初看时可能只是觉得炫酷的动作和复杂的叙事,但一旦深入挖掘,你会发现诺兰埋藏了许多让人后背发凉的细节,这些细节不仅深化了影片的主题,更增添了一层令人不安的宿命感。咱们就来掰扯掰扯那些“细思极恐”的点:1. 时间逆转的熵减悖论与普适性电影里对“熵减”的概念解释得很清楚:物体的时间逆转意.............
  • 回答
    《王国:北方的阿信》,这部韩剧以其浓郁的东方色彩和对人性深处的挖掘,着实让不少观众回味无穷。除了主线剧情的紧张刺激,仔细品味,你会发现剧中有不少“细思极恐”的细节,仿佛是埋在雪地里的冰锥,稍不留神便能刺痛心扉。首先,从阿信的眼神变化,就能窥见她内心的崩塌。刚开始的阿信,虽然生活在被视为“异类”的境地.............
  • 回答
    2013年10月16日,微信公众账号“小道消息”和“MacTalk”(即“Macworld China”)联合发布了一篇关于“极路由”(X router)的文章,这一事件在当时引发了广泛关注,成为国内互联网创业圈的标志性事件之一。以下从多个角度详细分析这一事件的背景、意义和影响: 1. 极路由的背景.............
  • 回答
    信息熵与热力学统计物理中的熵,虽然名称相似,并且在概念上有着深刻的联系,但它们的研究对象、定义方式以及应用领域都有着本质的区别。为了详细阐述,我们将从定义、产生背景、计算方式、度量对象、物理意义、应用领域以及两者之间的联系这几个方面逐一分析。 一、 定义与产生背景 1. 信息熵 (Informati.............
  • 回答
    咱们今天聊聊“信息熵”这个概念,听着挺玄乎,但其实它藏在我们身边,解释清楚了,你会觉得挺有意思的。信息熵,简单来说,就是衡量一件事有多少“不确定性”,或者说它能带来多少“信息量”。想象一下,你手里拿着一张扑克牌,你不知道它是什么花色、什么点数。这张牌在你看之前,充满了不确定性,对吧?它可能是红桃A,.............
  • 回答
    关于“世界上信息熵最大的语言是汉语吗?”这个问题,这是一个非常有趣也常常被提及的讨论点。但如果直接给出一个肯定的答案,说汉语就是信息熵最大的语言,那可能过于武断了。这其中涉及到一些复杂的概念和衡量标准,需要我们一点一点来剥开。首先,我们得明白“信息熵”是个啥意思。你可以把它想象成一个语言的“不确定性.............
  • 回答
    香农定义信息熵公式为 $ sum p log_2(p)$(离散情况)或 $ int p log_2(p) dp$(连续情况),这绝非随意为之,而是深深植根于信息论的核心思想以及人类对“不确定性”和“信息量”的直观理解。理解这一点,需要我们从几个关键角度去剖析。1. 量化“不确定性”:为什么是负对数?.............
  • 回答
    在《信息简史》里,作者乔治·格里德勒(James Gleick)用一种非常宏大的视角,为我们梳理了信息从诞生到传播的整个波澜壮阔的历史。读完这本书,你会发现,信息这种看不见摸不着的“东西”,其实无处不在,并且它以各种各样的形式存在着,影响着我们的世界。格里德勒在书中描绘了信息在不同时代、不同媒介中的.............
  • 回答
    信息泄露,这个词听起来或许有些平淡,但在现实生活中,它所带来的后果,往往比最惊悚的悬疑片还要令人心悸。我曾经亲眼见过,也亲耳听过,那些因为一场看似微不足道的泄露,而瞬间崩塌的人生。我们先从最直接的,也是最容易理解的开始。个人身份信息,也就是我们常说的“身份证大全”。一旦这些信息落入不法分子手中,你的.............
  • 回答
    信息学竞赛,尤其是像IOI(国际信息学奥林匹克竞赛)这种级别的,说它是“边缘竞赛”,那绝对是有点冤枉了。但如果要说它“大众化”到像高考语文、数学那样人人皆知,那确实也还差点火候。所以,我们可以说信息学竞赛,在某些圈子里是顶流,但在更广阔的社会认知里,还处在一个“逐渐被看见”的阶段。咱们得把“边缘”这.............
  • 回答
    在信息化浪潮席卷全球的今天,我们不禁要问:在那些高科技的导弹、无人机和网络攻击面前,人类古老的智谋,那些隐藏在战术、策略之下的心思较量,是否还能够像过往那样,对战争的走向产生决定性的影响?这个问题,绝非简单的“是”或“否”能够回答。答案是肯定的,但前提是我们要理解“智谋”在信息化时代的演变和升华。简.............
  • 回答
    信息化战争是否更贵?这恐怕是任何一个考虑军事现代化的国家都必须直面的一个重要问题。答案并非简单的“是”或“否”,而是 “是的,在很多方面,信息化战争确实意味着更高的成本,但这种成本的衡量和理解也需要更深入的视角。”要深入探讨这个问题,我们得拆解一下信息化战争究竟包含了哪些内容,以及这些内容是如何推高.............
  • 回答
    信息化战争:新时代的冲突模式信息化战争,顾名思义,是以信息为核心、以信息技术为支撑的新型战争形态。它不再是单纯的物质消耗战,而是信息优势、技术优势和人才优势的综合较量。这场革命性的转变,深刻地重塑了战争的性质、形态和运行方式。信息化战争的主要特点要理解信息化战争,我们必须深入剖析其鲜明的特征:1. .............
  • 回答
    信息化战争,这四个字听起来就带着一种冰冷而又极端的意味。它不是刀光剑影的肉搏,也不是炮火连天的传统战场,而是一场发生在信息流和比特海中的较量,其可怕之处,在于它对人类社会最根本的运作方式的颠覆,以及由此带来的无形却又致命的打击。想象一下,我们现在的生活,几乎完全建立在信息和网络之上。交通导航、金融交.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有