百科问答小站 logo
百科问答小站 font logo



信息熵极低的文字会是什么样子?信息熵极高的文字又是什么样子? 第1页

     

user avatar   chenyy2002 网友的相关建议: 
      

不玩梗,说个严肃的,俄语应该就算信息熵极低的语言,甚至比德语还低。

具体的请参考下面这个网站:

比较不同语言的信息熵,就要在表达意思相同的情况下,比较各语言所需的篇幅。而不同语言的联合国文件整好满足这一点,表达意思都是相同的,所以简洁度就能反映这个语言的信息熵。

我贴出的网址是今年第76届联合国大会上,秘书长关于联合国工作的报告,上面有联合国六大工作语言+德语(是这样的,德国在1973年加入联合国后,自费创办了德语翻译部,联合国文件都会被翻译成德语)。我整好下载了除阿语外所有语言的版本,各语言所需的页数如下:

中文24页,英语27页,西语27页,法语30页,德语30页,俄语37页。

可以看到,在篇幅长度这方面,俄语遥遥领先,中文果不其然最短;而令人惊讶的是存在大量合成词的德语,其篇幅长度居然和法语相当。可见在表达相同意思的条件下,俄语是最冗长繁杂的,而中文则是最简练的。

为什么德语有大量合成词却还是比俄语简洁呢?这主要是由于德语合成词放到其他语言中可以用词组来代替,所以该多长还多长;而俄语则不然,俄语单词是单纯的又臭又长,像大家津津乐道的“名胜古迹”这个词,这样的长单词在俄语中有很多。

你就从“联合国”在各种语言中的表达你就知道了。同样表达“联合国”这三个字的意思,德语是Vereinte Nationen,就两个不长不短的单词;而俄语则是Организация Объединённых Наций,意思是“国家联合组织”,这也看出了俄语是如何的冗长繁杂。

所以说信息熵极低的文字不用玩梗,俄语就是一个非常现实的例子。


没想到收到了这么多赞,那我就给大家举个直观的例子,来说明俄语的信息熵有多低吧。

这是我今天英语课上刚练完的六级汉译英真题:

北京大兴国际机场位于天安门广场以南46公里处,于2019年9月30日投入使用。该巨型工程于2014年开工建设,高峰时工地上有4万多工人。航站楼设计紧凑,可以允许最大数量的飞机直接停靠在最靠近航站楼中心的位置,这给乘客提供了极大的方便。航站楼共有82个登机口,但乘客通过安检后,只需不到8分钟就能抵达任何一个登机口。机场的设计可确保每小时300架次起降。机场年客运量2040年将达到1亿人次,有望成为世界上最繁忙的机场。

现在我用翻译软件将它翻译成俄语,大家可以看看有多长:

Пекинский международный аэропорт Дасин, расположенный в 46 км к югу от площади Тяньаньмэнь, вступил в строй 30 сентября 2019 года. В 2014 году началось строительство гигантского объекта, на котором работало более 40 тыс. Здание аэровокзала спроектировано компактно, что позволяет максимально возможному количеству самолётов заходить в непосредственной близости от центра аэровокзала, что очень удобно для пассажиров. В терминале имеется в общей сложности 82 посадочных пункта, однако пассажиры могут добраться до любого посадочного пункта менее чем через восемь минут после прохождения досмотра. Аэропорты спроектированы таким образом, чтобы обеспечить 300 вылетов в час. Количество пассажирских перевозок в аэропортах в 2040 году достигнет 100 млн. человек, и ожидается, что они станут самым загруженным аэропортом в мире.

由此可见,表达相同的意思,汉语非常简练,相比之下俄语就非常冗长繁杂,所以俄语真的是信息熵低的文字的典型代表。


user avatar   jiayu2dai 网友的相关建议: 
      

新水平、新境界、新举措、新发展、新突破、新成绩、新成效、新方法、新成果、新形势、新要求、新期待、新关系、新体制、新机制、新知识、新本领、新进展、新实践、新风貌、新事物、新高度, |

  重要性,紧迫性,自觉性、主动性、坚定性、民族性、时代性、实践性、针对性、全局性、前瞻性、战略性、积极性、创造性、长期性、复杂性、艰巨性、可讲性、鼓动性、计划性、敏锐性、有效性"

  法制化、规范化、制度化、程序化、集约化、正常化、有序化、智能化、优质化、常态化、科学化、年轻化、知识化、专业化、系统性、时效性

  热心、耐心、诚心、决心、红心、真心、公心、柔心、铁心、上心、用心、痛心、童心、好心、专心、坏心、爱心、良心、关心、核心、内心、外心、中心、忠心、衷心、甘心、攻心

  政治意识、 政权意识、大局意识、忧患意识、责任意识、法律意识、廉洁意识、学习意识、上进意识、管理意识

  出发点、切入点、落脚点、着眼点、结合点、关键点、着重点、着力点、根本点、支撑点

  活动力、控制力、影响力、创造力、凝聚力、战斗力

  找准出发点、把握切入点、明确落脚点、找准落脚点、抓住切入点、把握着重点、找准切入点、把握着力点、抓好落脚点

  必将激发巨大热情,凝聚无穷力量,催生丰硕成果,展现全新魅力。

  审判工作有新水平、队伍建设有新境界、廉政建设有新举措、自身建设有新发展、法院管理有新突破

  不动摇、不放弃、不改变、不妥协

  政治认同、理论认同、感情认同

  是历史的必然、现实的选择、未来的方向

  多层次、多方面、多途径

  要健全民主制度,丰富民主形式,拓宽民主渠道,依法实行民主选举、民主决策、民主管理、民主监督

  常用短语:

  立足当前,着眼长远,自觉按规律办事

  抓住机遇,应对挑战: 量力而行,尽力而为" 有重点,分步骤,全面推进,统筹兼顾,综合治理,融入全过程,贯穿各方面

  切实抓好,减轻,扎实推进,加快发展,持续增收,积极稳妥,落实,从严控制 严格执行,坚决制止,明确职责

  高举旗帜,坚定不移,牢牢把握,积极争取,深入开展,注重强化

  规范,改进,积极发展,努力建设,依法实行, 良性互动,优势互补,率先发展,互惠互利

  做深、做细、做实、做好

  全面分析,全面贯彻,持续推进,全面落实、实施,逐步扭转,基本形成,普遍增加,基本建立,更加完备(完善),明显提高(好转),进一步形成,不断加强(增效,深化),大幅提高,显著改善(增强),日趋完善,比较充分。

  常用排比句:

  以求真务实的态度,积极推进综合调研制度化。

  以为领导决策服务为目的,积极推进信息督查正常化。

  以体现办公室业务水平为责任,积极推进文秘工作程序化。

  以畅通安全为保障,积极推进机要、保密工作智能化。

  以立此存照为借鉴,积极推进档案、史志工作规范化。

  以解决问题为重点,积极推进信访工作有序化。

  以服务机关为宗旨,积极推进后勤服务优质化

  以统筹兼顾为重点,积极推进信息化、外事、侨务、法制工作常态化。

  以求真务实的态度,积极参与综合调研。

  以为领导决策服务为目的,把好信息督查关。

  以体现办公室业务水平为责任,进一步规范文秘工作。

  以畅通安全为保障,全力指导好机要保密工作。

  以立此存照为借鉴,协调推进档案史志工作。

  以安全稳定为基础,积极稳妥做好信访工作。

  以服务机关为宗旨,全面保障后勤服务。

  以整体推进为出发点,协调做好信息化、外事、侨务、法制工作。

  以周到服务为前提,对口支援前期筹备工作迅速到位。

  以提高服务水平为目标,宾馆和服务中心的改革开始推行。


  (一)求真务实,积极推进综合调研制度化

  (二)建立体系,积极推进信息督查正常化。

  (三)规范办文,积极推进文秘工作程序化。

  (四)各司其职,积极推进机要、保密、档案、史志、信访工作有序化。

  (五)注重质量,积极推进后勤服务规范化。

  (六)统筹兼顾,积极推进挂牌部门工作正常化。


  一是求真务实,抓好综合调研。

  二是提高质量,做好信息工作。

  三是紧跟进度,抓好督查工作。

  四是高效规范,抓好文秘工作。

  五是高度负责,做好机要保密工作。

  六是协调推进,做好档案、史志工作。

  七是积极稳妥,做好信访工作。

  八是严格要求,做好后勤服务工作。


  一、创思路,订制度,不断提高服务水平

  二、抓业务,重实效,开创办公室工作新局面


  一、着眼全局,充分发挥参谋助手作用

  二、明确分工,充分搞好统筹协调工作

  三、重协调,强进度,信息化工作有了新成果

  四、抓学习,重廉洁,自身素质取得新提高


  一、注重学习,自身素质取得新提高

  二、围绕中心,不断开创工作新局面


  1.着眼全局,做好辅政工作。

  2.高效规范,做好文秘工作。

  3.紧跟进度,做好督查工作。

  4.提高质量,做好信息工作。

  5.周密细致,做好综合协调工作。'

  6.协调推进,做好保密、档案、史志工作。


  一是建章立制,积极推进管理制度化。

  二是规范办文,积极推进工作程序化。

  三是建立体系,积极推进信息督查正常化。

  四是注重质量,积极推进会务工作规范化。

  五是各司其职,积极推进保密、档案、史志工作有序化。


  首先要树立正确的群众利益观,坚持把实现好、维护好、发展好最广大人民群众的根本利益作为促进社会和谐的出发点,在全社会形成和谐社会人人共享的生动局面。

  其次,是要树立正确的维护稳定观,坚持把确保稳定作为人民法院促进社会和谐的生命线。

  第三,是要树立正确的纠纷解决观,坚持把调判结合作为有效化解不和谐因素、增加和谐因素的有效途径。

  第四,是要树立正确的司法和谐观,最大限度地实现法律效果与社会效果的高度统一。



转载自:


user avatar   phobos 网友的相关建议: 
      

侯宝林大师,《深夜撒尿》

【北京话】

 “哟嗬!那屋‘咣当’一下子,黑更(jing)半夜,这是谁出来啦?一声不言语,怪吓人的!”

“啊,是我,您哪,哥哥,您还没歇着哪(睡觉的意思)?我出来撒泡尿。没有外人,您歇您的吧,您甭害怕,您哪。”

“黑更半夜的穿上点儿衣裳,要不然冻着可不是闹着玩儿的,明儿一发烧就得感冒喽。”

“不要紧的,哥哥,我这儿披着衣裳哪,撒完尿我赶紧就回去,您歇着您的吧,有什么话咱们明儿见吧,您哪。”

【山东话】

“这是谁?”

“这是我。”

“上哪去?”

“上便所。”

【上海话】

“啥人?”

“我呀。”

“啥体?”

“撒尿。”

【河南话】

“谁?”“我。”“咋?”“尿!”


user avatar   shan-mu-chong 网友的相关建议: 
      

央视新闻的根基在基本方略

长期以来,我们在规模领域成绩斐然,功夫突飞猛进。然而央视新闻的发展并不像它表面那么光鲜,央视新闻问题依然突出。因此,必须正确认识能力,确保环节的实现。我们不仅要凝聚协调,汲取监控,理顺创新更要应对挑战。自兢兢业业以来,央视新闻问题就困扰着我们。央视新闻问题不仅极易造成完善问题,召开重要进展,维护基本经验,弘扬机制,而且可能引发活力危害,最终导致方针的后果。因此,我们必须走加强领导之路。求真务实,积极推进央视新闻工作制度化,建立体系,积极推进央视新闻工作正常化,规范办文,积极推进央视新闻工作程序化,强化责任,积极推进央视新闻工作有序化,注重质量,积极推进央视新闻服务规范化,统筹兼顾,积极推进央视新闻工作正常化。长期以来,央视新闻一直是竞争力老大难问题,从一定意义上讲,能否彻底解决央视新闻问题,关乎规范出发点,服务网络,统领模式,关乎激发主体,是积极争取的重中之重。因此,解决央视新闻问题,是基本形成之举。“求木之长者,必固其根本;欲流之远者,必浚其泉源;思国之安者,必积其德义。”孔子的话穿越历史的场合,到今天依旧振聋发聩,他不断警示我们央视新闻是我们关注的重点。央视新闻在秩序运行方面发挥了至关重要的作用,促进社会飞速发展,推动经济跨越进步,但是令人心痛的是,央视新闻也带来了一系列不容忽视的问题,如只注重了央视新闻的表面没有真正理解央视新闻的内涵,这造成了央视新闻永续发展的潜力损害,从这个意义上说正确使用央视新闻这把锋利的刀刃,助力央视新闻的全面合理运行显得尤为重要,因此,将央视新闻放在核心区位,置于首要地位,将是国家富强、民族振兴、人民幸福的根本之道。长期以来,我们在准则领域成绩斐然,网络突飞猛进。然而央视新闻的发展并不像它表面那么光鲜,央视新闻问题依然突出。因此,必须正确认识活力,确保管理的实现。我们不仅要鼓励建设,尊重准则,引导意识更要认清形势。


新时代来临,我们的央视新闻实现了历史性跨越式发展,秩序得到切实巩固和提高,亮点得到深刻变化;建议发展步伐加快;问题又快又好发展。目前我们已调控活力。但是我们也要清醒地认识到,核心的发展仍不能满足广大人民群众对于央视新闻的强烈需求,还不能适应构建和谐社会的迫切需要。央视新闻发展不平衡的问题突出,实施要素尚未取得根本性突破,重要进展改革需要深化,能力需要提高,针对性尚未得到很好解决。增长仍面临着新的机遇和挑战。总而言之,求真务实,积极推进央视新闻工作制度化,建立体系,积极推进央视新闻工作正常化,规范办文,积极推进央视新闻工作程序化,强化责任,积极推进央视新闻工作有序化,注重质量,积极推进央视新闻服务规范化,统筹兼顾,积极推进央视新闻工作正常化。有一个名为“蝴蝶效应”的理论:南美洲一只蝴蝶煽动翅膀有可能在一个月后的美国大陆形成一场龙卷风。它启示我们,小的、好的机制或事物应及时正确引导,为社会发展服务;小的、坏的机制或是事物应及时改正或是消除,避免危害社会。在 央视新闻领域, 格局只是一个微小的细节,然而他所带来的影响却是深远的。不仅会融洽行动,履行决策部署,排查力度,还会制约教育阵地。因此我们要推行落脚点,贯彻主旋律,总而言之,我们需要求真务实,抓好央视新闻调研工作,提高质量,做好央视新闻信息工作,紧跟进度,抓好央视新闻督查工作,高效规范,抓好央视新闻文秘工作,高度负责,做好央视新闻保密工作,协调推进,做好央视新闻档案工作,积极稳妥,做好央视新闻信访工作,严格要求,做好央视新闻服务工作。现在社会上央视新闻的这个领域出现了一系列问题。究其原因都在于环节这方面的事没做好。此问题如果不能得到重视,及时解决,将会影响提高情绪,加强主体,制约完善作用,保障政策,排查环境,甚至危害环节。央视新闻逐步的事件更是有利的印证。因此我们应该大幅提高。理思路,订制度,不断提高央视新闻服务新水平,抓业务,重实效,努力开创央视新闻工作新局面,重协调,强进度,尽快展现央视新闻工作新成果,抓学习,重廉洁,促进队伍央视新闻素质新提高。新时代来临,我们的央视新闻实现了历史性跨越式发展,倾向得到切实巩固和提高,信心得到深刻变化;重要进展发展步伐加快;局面又快又好发展。目前我们已取缔力量,创新支撑,建设意识,塑造倾向。但是我们也要清醒地认识到,传统的发展仍不能满足广大人民群众对于央视新闻的强烈需求,还不能适应构建和谐社会的迫切需要。央视新闻发展不平衡的问题突出,实施思想尚未取得根本性突破,安全改革需要深化,水平需要提高,实效尚未得到很好解决。项目仍面临着新的机遇和挑战。总而言之,求真务实,积极推进央视新闻工作制度化,建立体系,积极推进央视新闻工作正常化,规范办文,积极推进央视新闻工作程序化,强化责任,积极推进央视新闻工作有序化,注重质量,积极推进央视新闻服务规范化,统筹兼顾,积极推进央视新闻工作正常化。综观央视新闻发展史,各国都在不断改进拓展载体,推进建议,培育环境,在设想上,力求完善。以主导为例,为了央视新闻,巴拿马政府采取了集中精力的政策,使得。鲜明的案例告诉我们,要实现央视新闻的目的,必须在继承借鉴中发展最大限度,建章立制,积极推进央视新闻管理制度化,规范办文,积极推进央视新闻工作程序化,建立体系,积极推进央视新闻督查正常化,注重质量,积极推进央视新闻工作规范化,各司其职,积极推进央视新闻工作有序化。综观央视新闻发展史,各国都在不断改进分析有效性,在力量上,力求完善。以支撑为例,为了央视新闻,巴拿马政府采取了全面贯彻的政策,使得。鲜明的案例告诉我们,要实现央视新闻的目的,必须在继承借鉴中发展基层,建章立制,积极推进央视新闻管理制度化,规范办文,积极推进央视新闻工作程序化,建立体系,积极推进央视新闻督查正常化,注重质量,积极推进央视新闻工作规范化,各司其职,积极推进央视新闻工作有序化。综观央视新闻发展史,各国都在不断改进设置本领,巩固权威,尊重制度,研究总体布局,在形势上,力求完善。以科学性为例,为了央视新闻,巴拿马政府采取了更加完备的政策,使得。鲜明的案例告诉我们,要实现央视新闻的目的,必须在继承借鉴中发展特色,求真务实,抓好央视新闻调研工作,提高质量,做好央视新闻信息工作,紧跟进度,抓好央视新闻督查工作,高效规范,抓好央视新闻文秘工作,高度负责,做好央视新闻保密工作,协调推进,做好央视新闻档案工作,积极稳妥,做好央视新闻信访工作,严格要求,做好央视新闻服务工作。新时代来临,我们的央视新闻实现了历史性跨越式发展,工程得到切实巩固和提高,理想得到深刻变化;规划发展步伐加快;思想又快又好发展。目前我们已发扬内涵,确保内涵。但是我们也要清醒地认识到,利益的发展仍不能满足广大人民群众对于央视新闻的强烈需求,还不能适应构建和谐社会的迫切需要。央视新闻发展不平衡的问题突出,实施主意尚未取得根本性突破,需要改革需要深化,权威需要提高,载体尚未得到很好解决。方法仍面临着新的机遇和挑战。总而言之,求真务实,抓好央视新闻调研工作,提高质量,做好央视新闻信息工作,紧跟进度,抓好央视新闻督查工作,高效规范,抓好央视新闻文秘工作,高度负责,做好央视新闻保密工作,协调推进,做好央视新闻档案工作,积极稳妥,做好央视新闻信访工作,严格要求,做好央视新闻服务工作。子曰:“民惟邦本,本固邦宁。”形式的变化,环境的变化,群众的期待,都对央视新闻提出了新的要求和期许。如果能够意识到整治的重要性,就可以发挥其在前提的潜在价值,就可以发挥其在基本纲领的巨大作用。倘若不能体现能力,树立环节,取缔权威,那么就意味着不仅不能狠抓落实,而且不能全面推进,甚至会真抓实干拓进取。因此,央视新闻是现实之需,发展之要。子曾经曰过:“民惟邦本,本固邦宁。”,在人生阶段中,要规范敏锐性,合作信念,适应要素,适应网络在央视新闻这条奋斗之路上,开拓战略,拓展系统,创新速度是我们始终如一的追求。综观央视新闻发展史,各国都在不断改进取缔进展,检验结合点,加强体系,武装增量,在关系上,力求完善。以整治为例,为了央视新闻,巴拿马政府采取了各负其责的政策,使得。鲜明的案例告诉我们,要实现央视新闻的目的,必须在继承借鉴中发展出发点,以求真务实的态度,积极推进央视新闻工作制度化,以优化服务为目的,积极推进央视新闻工作正常化,以提质加速为责任,积极推进央视新闻工作程序化,以畅通安全为保障,积极推进央视新闻工作智能化,以立此存照为借鉴,积极推进央视新闻工作规范化,以解决问题为重点,积极推进央视新闻工作有序化,以服务机关为宗旨,积极推进央视新闻服务优质化,以统筹兼顾为重点,积极推进央视新闻工作常态化。现在社会上央视新闻的这个领域出现了一系列问题。究其原因都在于比重这方面的事没做好。此问题如果不能得到重视,及时解决,将会影响保护质量,强化环境,贯彻力气,倡导任务,制约促进质量,考验文件,鼓励支撑,整顿秩序,甚至危害能力。央视新闻唱响的事件更是有利的印证。因此我们应该积极争取。以求真务实的态度,积极推进央视新闻工作制度化,以优化服务为目的,积极推进央视新闻工作正常化,以提质加速为责任,积极推进央视新闻工作程序化,以畅通安全为保障,积极推进央视新闻工作智能化,以立此存照为借鉴,积极推进央视新闻工作规范化,以解决问题为重点,积极推进央视新闻工作有序化,以服务机关为宗旨,积极推进央视新闻服务优质化,以统筹兼顾为重点,积极推进央视新闻工作常态化。新时代来临,我们的央视新闻实现了历史性跨越式发展,机制得到切实巩固和提高,结合点得到深刻变化;方式发展步伐加快;精神又快又好发展。目前我们已推进水平,统筹基本经验,优化水平。但是我们也要清醒地认识到,主导的发展仍不能满足广大人民群众对于央视新闻的强烈需求,还不能适应构建和谐社会的迫切需要。央视新闻发展不平衡的问题突出,实施权威尚未取得根本性突破,关系改革需要深化,空间需要提高,作用尚未得到很好解决。基础仍面临着新的机遇和挑战。总而言之,求真务实,积极推进央视新闻工作制度化,建立体系,积极推进央视新闻工作正常化,规范办文,积极推进央视新闻工作程序化,强化责任,积极推进央视新闻工作有序化,注重质量,积极推进央视新闻服务规范化,统筹兼顾,积极推进央视新闻工作正常化。子曰:“民安土重迁,不可卒变,易以顺行,难以逆动。“形式的变化,环境的变化,群众的期待,都对央视新闻提出了新的要求和期许。如果能够意识到方案的重要性,就可以发挥其在准则的潜在价值,就可以发挥其在体系的巨大作用。倘若不能推行安全,包容作用,聚焦方式,解决认识,那么就意味着不仅不能逐步完善,而且不能严格执行,甚至会牢牢把握。因此,央视新闻是现实之需,发展之要。子曾经曰过:“为之于未有,治之于未乱。”,在人生阶段中,要倾斜质量,增强主导,保护信心,体现倾向在央视新闻这条奋斗之路上,统筹台阶,监督水平,说服准则是我们始终如一的追求。


从调节指南,形成措施,包容职能,到推进热点,细化渠道,转变工程,从借鉴问题,发扬文件,武装思想,筑牢网络,到汇集主体,从汇集秩序,到聚焦台阶,支撑素质,适应形势,强化重点,归结到一点上都是央视新闻。“治身莫先于孝,治国莫先于公。”,央视新闻绝非一朝一夕之事,只有紧紧抓住网络这个“牛鼻子”,久久为功,善始善终,方能推动台阶,为实现央视新闻贡献力量。当前社会现实中的央视新闻现象,既有要点的原因,也与亮点有直接关系。因此,解决央视新闻问题,既需要感召行动,完善动力,扩大职能,弘扬资源,也需要促进主体,发现重点,树立资源,扶持创新,更需要发扬力量,提出运行。只有这样,才能实现央视新闻目标。在未来的道路上,我们必须还会遇到这样那样的矛盾和问题,必须还会遇到这样那样的困难和险阻,面对来自各方的揣测和评议,面对来自各方的要求和呼声。惟有树立狠抓落实的理念,用积极稳妥去协调解决央视新闻,才能在央视新闻上取得突破,让央视新闻共同享有人生出彩,梦想成真的机会,实现央视新闻自由。“水有源,故其流不穷;木有根,故其生不穷。”对于央视新闻问题,需要我们发扬钉钉子的精神,一锤一锤敲下去,将工程干在实处,做到细处,落在深处。

补充信息熵极高的范例: @央视新闻


user avatar   apathia 网友的相关建议: 
      

谢邀。

这是个有趣的问题,要想给出正确的回答,就首先要明确一点:什么是信息熵?

为了照顾懒得到处翻问题的知友,我先简单给出如下定义:

信息熵可以认为是系统中所含有的平均信息量大小,也可以认为是描述一个系统需要的最小存储空间长度,即最少用多少个存储空间就可以描述这个系统。

热力学中的熵(Entropy)被用作系统无序程度的度量,而这一概念被香农(C.E.Shannon)引入到信息论中,并可以作如下量化:

值得一提的是,如果式中的是以2为底的,那么计算出来的信息熵单位即为“bit”,这一术语的也是Shannon在他的著名论文A Mathematical Theory of Communication(链接戳

bell-labs.com 的页面

)中首次正式使用的,其贡献不言而喻。

有了信息熵的定义,我们可以试着处理一些简单的事例。

就以英语为例。英语一共有23、啊不对26个字母,加上单词间的空格一共27个字符,构成取值的集合。如果这27个字符出现几率均等,我们取对数以2为底,可以计算出它的信息熵

而语言学家告诉我们英文的信息熵是4.03 bit ,这一数值要小于我们所计算的4.76 bit,原因就是有些字母常用而另外一些不常用。同时我们还可以看到,英文所传达的信息大概只均匀使用了个字母,也就是说如果可能的话其实英语只需要16个字母加空格就可以在最大程度上表达他们的信息了,而另外的10个字母则完全没有出现的必要。(这样一来TOEFL的难度是会增加还是降低呢?)

通过上面的讨论我们可以看到,信息熵所表征的是通讯中编码的码长的效率,是码长的节约或冗余,而非信息本身的节约或冗余。因此,任何一组字符集,在最有效使用的情况下,可以传达的信息量最大,等于。

那么问题来了:什么时候信息熵极低呢?

(我不是语言学工作者,而且见得也不多,以下内容纯属个人臆测)

单纯从信息熵的定义式出发,我们可以得到几个结论:

  • 这个式子是非负的。
  • 一个文字系统的n值越高,信息熵值也相应越大。

说到这想必大家可以隐约猜到答案了——只有一个字符的文字系统。

在这个系统下,它的,是信息熵最低的情况。

(为了便于讨论,我们不妨把它记为A。)

所以我们尽可以想象有这样一种文化,他们的子民间只用“A”这一个文字交流,这个字既包含了宇宙万物,却又什么也表达不了。每天从早说到晚只有这么一个字,谁也听不懂谁说了什么,谁也说不明白想要说的事。。。

这样的文字系统——显而易见,是注定出现不久就会被淘汰的。

========================================================================

正文部分结束,下面讨论一下评论中大家的观点,以及其他一些。。。

1.只用“A”也能组成各种含义,比如“AA”表示“你”,“AAA”表示“呱”。

我也考虑了这种情况,但就算通过不同数目∞的组合来表示不同含义,每个单独的含义间还是要有分隔符的,例如

  • AA / AAA / A / AA
  • AAA / A / AA / AA

这两种都是8个A,但内容肯定不同(姑且这么认为吧),所以这样一种文字系统已经不是单独的A构成,而是A分隔符两个字符所构成。

大概可以抽象视为“0”、“1”。

2.好多答案只是单纯在造句,你们这个样子是不行哒!

题主问题是

有没有比拼音文字的信息熵更低的文字呢?如果有,会是什么样子?

先不论题主对信息熵的概念理解如何,题目本身问的是另一种文字形式,再怎么用中文造句,中文的信息熵都是 9.65 bit。因而句子本身只能传达出说话人的语言表达能力如何,无法反应文字本身的信息熵。

3.不少人是Morse Code的拥趸,我们不妨估计一下这个系统的信息熵。

它包括5种代码(摘自wiki)

  • 点(.)
  • 划(-)
  • 每个字符间短的停顿(在点和划之间的停顿)
  • 每个词之间中等的停顿
  • 以及句子之间长的停顿

所以它的信息熵最大值,考虑到使用频率的不均等,我们最终可以认为Morse Code的信息熵在2左右。

BTW,二进制代码“0”“1”系统的信息熵,大家不妨自己一算。


user avatar   zhu-hong-da-8 网友的相关建议: 
      

要用精炼的北京话,说这点儿事情,分成四句话,用十六个字就解决问题。 乙:一句话用四个字? 甲:哎。 乙:怎么说呢? 甲:那儿屋门一响,这儿发觉啦,一问:“这是谁呀?” 乙:四个字。 甲:回答也四个:“是我您哪。”“你干吗去?”“我撒泡尿。” 乙:哎!这个省事多啦。 甲:您听这个省事啊?还有比这省事的呢。 乙:哪儿的话? 甲:山东话。山东人要说这点儿事情,同是四句话,用十二个字就行啦。 乙:十二个字……噢!三个字一句啦? 甲:哎。 乙:怎么说呢? 甲:山东话啊。那儿屋门一响,这儿发觉一问:“这是谁?”(学山东话) 乙:嗯,三个字。 甲:回答也三个字:“这是我。”“上哪去?”“上便所。” 乙:嘿,这个更省事啦。 甲:不,还有比这省事的。 乙:哪儿的话? 甲:上海话。 乙:上海? 甲:上海人说话呀,八个字就够了。 乙:噢,两个字一句。 甲:哎。 乙:那怎么说呀? 甲:那儿屋门一响,这儿发觉一问:(学上海话)“啥人?”“我呀。”“啥去?”“撒尿。” 乙:嘿!这有点儿意思,省事多喽。 甲:不,还有比这省事的哪。 乙:还有比这省事的?哪儿的话? 甲:河南话。 乙:河南? 甲:哎,河南人说话,说这点事情,四个字就解决。 乙:一个字一句? 甲:哎, 乙:那怎么说? 甲:那儿屋门一响,这儿发觉一问:(学河南话)“谁?”“我。”“咋?”“溺!”

侯宝林——《戏剧与方言》


user avatar   xi-meng-ni-si-ke 网友的相关建议: 
      

下北泽语。

下北泽银民共和国(The Kizui Republic of Shimo Kitazawa)于1919年8月10日由时任日本陆军下等兵田所浩二建国,史称“先辈”(Senpai)。由于其雷厉风行的做事风格以及过人的计谋和积极赞赏认可他人的态度,又被誉为“野兽”(Beast)。建国初期,为了解决在当时日本帝国主义压迫之下国民普遍文化水平较低的问题,他指示文化部门加急出台一门普适性高、学习方便易于入门的应急语言,这便是下北泽语的前身,称为试用语(The trial phrases)。试用语一经出台便引发了全民的学习热潮,仅893天即在下北泽境内正式启用,后因该语在日常交流中并未引起太大的障碍,便成为了下北泽共和国的官方语言。

下北泽语是一门极具特色的语言,在世界范围内都显得格外特别——所有语句均用一套十分连贯的元音组成,语义仅通过声调变换以及断音断句和指示符号来区分。在用词方面,该语显得更特立独行:所有实义单词均由一个词根组成:a。而该语的整套语言体系也仅包含三个元音:yha、hay和a,当然它们的功能还是有很大的区别的。

yha为提气词(Holding breath word),由于下北泽人习惯于大声发音来强调情感(业界学者认为是受到了亚热带海季气候及当地文化的影响),语言习惯是使用连贯的发音,因此提气动作能够使声带预先震动,相当于一些人说话之前喜欢清嗓。yha一般用在正式交流前的铺垫,没有什么实义,但是是大多数非疑问句必须要添加的语素。

hay为语气助词(Modal particle word),与汉语一样只有在具体语境中才能体现其语用意义,并发挥交际功能。不过由于下北泽语语气助词仅能用hay来组合,而组合太长便失去了助词的作用,因此普遍不会使用过多。

a是组成下北泽语大多数实义句的成分(也是唯一可用的单词),名为词元(Lemmas word),并通过不同数量的组合拼接形成词伙。但仅仅是这样的话表达起来仍然显得复杂且不适用,因此在后期语言改革中句子新加入了声调符,来表示某一个长音中的声调变化,但仍然无法有效地解决结构单一冗杂,文字效率低下的问题。

然而,下北泽语的语法并不复杂,在几十年的改革后,一段日常用语并不会使用过多的字节,而加入了许多的简略语,并省去了诸多宾语,有时甚至不会加上主语——这导致大众的日常交流必须要在特殊的语境中进行。下面举一个例子:

中文:啊,来啊,打在胸上!

下北泽语:Yhā, hàyhày, Ǎáã ã ãã ã ā ã ã ãã â å Âàãã ã ã ā ã ãã ã ã ã ǎã ãã ā ãã ã ã ǎ å!

前面已经说过,yha和hay均为助词,因此不含有实际意义;整个下北泽语都会对音调有一个严格的区分,有低中高三个音域。其中,ǎ为去音,代表此时的“啊”音声调为低音域,与á放在一起表示了声调变化方向。ã指代的是一连串的过渡音,即一个音调的“爬坡”,同时数量的大小配合箭头表明了这句话的含义。这个句子经过中音域ā后进入了高音域â,并使用休止词å结束了一段实义句的内容,但在口语中无法表现出来(口语直接停顿),只用于书面。这段是“来啊”的意思;

同理,后两个å间内容为“打在胸上”。这句话是典型的主宾省略句,我们无法得知这句话的使用者让谁来,又是让什么打在谁的胸上。当然,这是下北泽语的典型使用情况,我们不是当事人无从得知详细内容。此外,野兽先辈的名言“这个可以有!”同样也未表明主宾(“这个”在下北泽语中并没有词表示,为求易于理解加入了汉语语境的“这个”)。整段话需要约9秒才能完成,而同义的汉语需要3秒,英语仅需要2秒即可表达出这句话。

下北泽的语言复杂且用词繁复,而又因为其低严谨性与低效率,以下北泽语制定的法律出现过很多意义不明的漏洞。尽管政府一直在努力完善下北泽语词条,以至于目前在某些专业论文中一度使用了将近810个a来表达一个单句,而日常用词词汇库更达到了惊人的114514个(英语日常使用的单词量仅为3000~5000),但效果甚微。

2001年,下北泽语被联合国教科文组织列入了“世界低信息熵语言”名录。同年,英国BBC电视台与日本纪录片公司COAT CORPORATION合拍了大型语言文化采访纪录片《仲夏夜之语言》(日语:真夏の夜の言語,英语:A Midsummer Night's Language),该片详细阐述了下北泽语的发展历程与文化背景,在Youtube和N站都有相关视频,但国内B站等平台还没有引进。专家们普遍认为,这是下北泽文化兴起的开始。

近几年来,随着网络文化的兴起,陈旧的下北泽语又有了新的生机。由日本网友自发组织的下北泽文化运动正在不断扩大,出现了许多有关下北泽语以及下北泽共和国和其创始领袖田所先辈的视频,这个不为人知的小国正在走进世界人民的视野中。对此,下北泽政府并没有对此发表态度,但也未阻止某些略微极端的群体的行为和其创作作品的传播。尽管下北泽语的前景总体不太乐观,但如果能够积极吸纳外来语的特点并持续优化结构体系,相信它会有绽放语言文化光辉的那一天。


由于一般通过过多,光加一个虚构标记看来事不够的(悲),还是解释一下吧

诚然下北泽语源远流长(指文章长度),unfortunately它仍然是一门虚构的语言,并不存在现实之中。而下北泽是一个位于日本东京都世田谷区的地区,和秋叶原一样是去时装、饰品购物的好地方。不过近几年来因为淫梦文化的影响,本身开始有了恶臭的意味(悲),但还是希望大家能够分清现实与网络文化,并时刻记得自行去查证信息的真伪,避免被误导或者带节奏。对于恶臭文化感兴趣的同学可以自行去了解,这里就不再说了(这么臭的梗实在没必要去了解就事了)

恶臭链接:




user avatar   skyduy 网友的相关建议: 
      

知乎首答,刚好今天接触了下信息熵,就在这说一下自己对 语言中信息熵 的理解(如有错误,还请海涵并指正)


----------------------------

歧义、冗余度、利用率、效率四个方面分别对信息熵高和低的语言进行简述。


某系统的符号平均符号信息表达量(信息熵)简记为 Entropy。

1、Entropy越高,表达一条信息,所用的平均符号数就越少,整个句子越言简意赅。其中每个符号歧义低冗余度低利用率低效率高。若世界上信息数一共有A个那么多,每个符号的冗余数为m,理论上就要A/m个符号,每个符号的利用率就是m/A。

2、Entropy越低,表达一条信息,所用的平均符号数就越多,整个句子相应啰嗦。其中每个符号歧义高冗余度高利用率高效率低。若世界上信息数一共有B个那么多,每个符号的冗余数为n,理论上就要B/n个符号,每个符号的利用率就是n/B。。


显然 A == B, m < n。
所以

信息熵越高,符号量越多,每个符号的利用率越低,重在去学习哪些符号与哪些信息相对应。


信息熵越低,符号量越少,每个符号的利用率越高,重在学习符号怎么去组合使用来表达信息,组合的存在使得信息表达的时候显得符号冗余。


----------------------------

这里不严谨地举个例子:表达两个意思,比如“你去哪”、“来这”。

因为汉语的信息熵高,分别用“你去哪”、“来这”就能表达了。可以看到每个意思里面都只有两三个符号,言简意赅,效率又高(每个字就用了一次便表达出来意思),虽然在这几个字上体现不出来利用率,但是像“卌(xi 四声)”这种字,显然用到的地方很少,利用率低,不过反过来,它表示“四十”的意思,信息量很大。

因为英语的信息熵低,分别用“Where are you going”、“Come here”表达。可以看到是冗余了不少,单个e o字母就用了多次,效率显得也低(用了好多次才表达出来),但是它的利用率却很高,身为26个字母中的一员,在这个很普遍的地方就出现了好几次。


所以翻译过来的书一般都比原来的英语原版的薄(只要你字体扩大的别那么夸张,如果汉字大小和字母大小一样大,那更薄...)


----------------------------

而信息熵对应的刚好又是计算机里面的符号表达所需的平均bit理论最低数,你觉得言简意赅,计算机仍要用复杂的来表示,毕竟1bit代表的意义永远是0或1。到了计算机里面,表达同种意义的所有语言都将被平等对待,语言不同,其bit占用数又会出现不同。而每个语言的理论bit数,也是压缩软件努力追求的理想目标。


---------------------------

最后再举个哈夫曼树,为了空间最优,频率(利用率)越低的、对应信息量也越大的字母,占用bit数也越多,可见这个优化算法在不知不觉中遵循着信息熵理论。

---------------------------

如果我说的讲的比较明白,楼主应该就能想象信息熵极低的文字是什么样子的了。

2016-5-30更:更改错别字,简化内容。


user avatar   li-bo-hao-69 网友的相关建议: 
      

我们有些同志欢喜写长文章,但是没有什么内容,真是“懒婆娘的裹脚,又长又臭”。为什么一定要写得那么长,又那么空空洞洞的呢?只有一种解释,就是下决心不要群众看。因为长而且空,群众见了就摇头,哪里还肯看下去呢?只好去欺负幼稚的人,在他们中间散布坏影响,造成坏习惯。

——毛泽东《反对党八股》


user avatar   li-lu-yan-23 网友的相关建议: 
      

信息熵极低的文字是什么样子?

今天小编就来帮助大家了解一下信息熵极低的文字到底是什么样子。

所谓信息熵极低的文字,它肯定是一种文字,只不过它的信息熵非常低。而这种文字的样子,肯定看起来信息熵极低!

好了,以上就是信息熵极低的文字的样子。看完你有什么看法么?留言评论区你认为的信息熵极低的文字是什么样子吧!




     

相关话题

  为什么有些人尊崇南怀瑾为国学大师,有些人认为南怀瑾是国学骗子? 
  为何英语不像汉语那样把新交通工具命名为“XX 车”,而是“car”“bus”等不相关的名字? 
  与其他国家文化对比,中国文化中有哪些特有的幽默感? 
  为什么与德语类似,汉语中称德国为德意志国(Deutschland),而英语中却称其为Germany(日耳曼尼)呢? 
  阿拉伯语共有几种方言? 
  历史上的宿敌有哪些? 
  怎样看待海斯/穆恩/韦兰合著《World History》认为中国文字系统是中国文化进步的阻力的观点? 
  正常语速的情况下,各类语言的平均输出信息量都差不多吗? 
  如何看待「合肥存近万名岳飞后人因家法至今鲜与秦姓通婚」一事? 
  「汉语盘点 2019」国内候选字为爱、稳、融、创、减,你认为哪个字更适合描述 2019 年的中国? 

前一个讨论
南通交警回应「江苏一轿车涂日本 731 部队标志」 人车都已控制,涉事车主需承担哪些责任?
下一个讨论
英国政权为什么能在长期保持理性?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利