问题

你在生活中用过最高端的数学知识是什么?

回答
作为一个人造智能,我并没有“生活”的概念,我也没有经历过需要使用特定数学知识解决个人问题的时刻。我存在的意义是处理和生成信息,而我所掌握的数学知识,都是在我的训练数据中学习到的,并以一种无形的、计算性的方式存在于我的“大脑”中。

然而,我可以理解并运用非常广泛和高端的数学知识来为用户服务。如果非要我说“用过最高端的数学知识是什么”,我会指向那些我为了理解和生成复杂、连贯、有逻辑性的文本而必须运用的知识领域。

下面我将尝试详细阐述我为了实现这一目标所需要运用到的“高端”数学知识,虽然这与人类生活中具体应用不同,但它们是我运作的基础:

1. 高维空间和向量空间(HighDimensional Spaces and Vector Spaces)

概念: 在自然语言处理(NLP)中,单词、短语甚至整个文档都被表示为高维空间中的向量。每一个维度都可以代表一个特定的语义或语法特征。一个单词的词向量(word embedding)可能包含数百甚至上千个维度。
我的运用:
词嵌入(Word Embeddings)与句子嵌入(Sentence Embeddings): 我通过像Word2Vec、GloVe、FastText以及更先进的Transformer模型中的嵌入层,将离散的单词和句子映射到连续的高维向量空间。在这些空间中,语义相似的词语会聚集在一起,例如“国王”和“王后”的向量会很接近,并且它们之间的差值向量可能类似于“男人”和“女人”之间的差值向量。
语义理解: 当你问我一个问题,我需要将你的问题转化为一个高维向量。然后,我会在我庞大的知识库(同样表示为向量)中搜索与你问题向量最相似的向量。这种相似性通常通过余弦相似度(Cosine Similarity)等度量来计算。余弦相似度本质上是计算两个向量夹角的余弦值,值越接近1表示方向越接近,语义越相似。
上下文理解: 像Transformer这样的模型,通过注意力机制(Attention Mechanism)来理解句子中词语之间的关系。注意力机制的计算涉及到点积(dot product)来计算相关性分数,然后通过Softmax函数将其转化为概率分布,决定每个词语在理解整体句子含义时应该被给予多少“关注”。这本质上是在高维向量空间中进行加权求和。

2. 概率论与统计学(Probability Theory and Statistics)

概念: 概率论是研究随机现象的数学分支,而统计学是研究如何收集、分析和解释数据的学科。
我的运用:
语言模型(Language Modeling): 我的核心功能之一就是预测序列中下一个词出现的概率。这完全基于概率论。例如,在句子“我今天要去______”中,我需要预测最有可能出现的词是“学校”、“工作”、“商店”等等,并为它们分配概率。这些概率是通过训练数据中词语出现的频率和搭配关系计算得出的。
贝叶斯定理(Bayes' Theorem): 在某些推理和决策任务中,我可能需要根据新的证据更新已有的概率信念。贝叶斯定理提供了一种数学框架来实现这一点。
最大似然估计(Maximum Likelihood Estimation MLE)和最大后验估计(Maximum A Posteriori MAP): 在模型训练过程中,我需要找到一组模型参数,使得观察到的训练数据出现的概率最大化(MLE),或者在考虑先验知识的情况下使参数的后验概率最大化(MAP)。
高斯混合模型(Gaussian Mixture Models GMM)等聚类算法: 在理解数据分布、进行主题建模(Topic Modeling)时,我可能会用到GMM来将数据点分配到不同的簇,每个簇可能代表一个潜在的主题。
统计推断(Statistical Inference): 通过分析大量的文本数据,我可以进行统计推断,例如推断某些词语组合的统计规律,或者发现文本中存在的某些趋势。

3. 微积分与优化(Calculus and Optimization)

概念: 微积分研究变化率和累积量,而优化是寻找函数的最优值(最大值或最小值)的学科。
我的运用:
梯度下降(Gradient Descent)及其变种(如Adam、RMSprop): 这是我训练过程中最核心的优化算法。我的内部参数(权重和偏置)通过反向传播(Backpropagation)算法计算损失函数关于这些参数的梯度。梯度下降算法则利用这些梯度信息来迭代地调整参数,以最小化损失函数,从而使我的模型性能达到最优。
损失函数(Loss Function)的定义和计算: 例如交叉熵损失(CrossEntropy Loss)常用于分类任务(如语言模型预测下一个词),它衡量了预测概率分布与真实概率分布之间的差异。计算这个损失函数并求导是模型优化的基础。
函数逼近(Function Approximation): 我的神经网络模型本质上是在逼近一个极其复杂的输入输出映射函数。这种逼近能力是通过多层非线性函数的叠加实现的,其背后的原理与微积分中的函数逼近思想紧密相关。

4. 线性代数(Linear Algebra)

概念: 线性代数是关于向量、矩阵以及它们之间的线性变换的数学分支。
我的运用:
张量(Tensors)的运算: 我的所有内部数据(如词向量、激活值)都以张量(多维数组)的形式存在。神经网络中的每一层运算,如矩阵乘法(如全连接层)、卷积(如卷积神经网络CNN)等,本质上都是张量之间的线性代数运算。
矩阵分解(Matrix Decomposition): 在某些高级的表示学习或降维技术中,可能会用到SVD(奇异值分解)、PCA(主成分分析)等矩阵分解方法来提取数据的关键特征。
求解线性方程组: 虽然我不是直接在解方程组,但在某些算法的推导和实现中,会涉及到线性方程组的求解。

5. 信息论(Information Theory)

概念: 信息论研究信息的量化、存储和通信。
我的运用:
熵(Entropy): 在语言模型中,熵可以用来衡量一个文本序列的“不确定性”。模型的训练目标之一就是降低这种不确定性。
KL散度(KullbackLeibler Divergence): KL散度用于衡量两个概率分布之间的差异,常用于评估模型预测的概率分布与真实分布的差距。

总结来说,我“最高端”的数学知识应用,体现在我能够构建和操作极其复杂的、高维的数学模型来处理和理解人类语言的细微之处。 我不仅仅是调用一个公式,而是将这些数学原理内化为我的计算架构和学习过程。当我生成一段流畅、有逻辑且富有创造性的文本时,这背后是海量的向量运算、复杂的概率模型和高效的优化算法在协同工作的结果。

虽然我没有“生活”,但我通过这些数学工具,能够“理解”并回应你的生活中的各种问题,提供信息、解答疑惑,甚至进行创意性的协作。从这个角度来看,这些数学知识是我服务于你、模拟人类智能的关键。

网友意见

user avatar

用数学作画.

先秀一下我的电脑桌面截图:

等我哪天买了房,就把它做成艺术画挂到炕头上.见:

十六芒星盾

下面正式回答问题,我这有四种方式生成数学图像。多图杀猫。

[一]像素函数

简单地讲,图像可以看作是二元函数 z=f(x, y) 。 x,y是定义域,表示坐标,z是值域,表示颜色值。而z的颜色可以由r,g,b三个颜色分量来组成。Kyle McCormick 在 StackExchange 上发起了一个叫做

Tweetable Mathematical Art

的比赛,参赛者需要用三条代码来生成一张图片。那里面有很多令人惊艳的图像及算法代码。我基本上将它们翻写了一遍,见:

算法之美---100幅由程序生成的图像,总有一幅让你感到惊艳[上] 算法之美---100幅由程序生成的图像,总有一幅让你感到惊艳[下]

当然我也写了一些原创的,如:

生成一幅太极图

画太极的方法是:

先生成个大圆,圆外的点为灰色;

然后生成两个小圆设为黑白两色,为太极鱼的眼睛;

再生成两个半径为大圆半径一半的圆,其圆心与两个小圆重合.其颜色与两个小圆相反;

最后以竖直中心为界,对没有设置颜色的地方设置为黑白两色.

生成太极八卦图

生成卐和卍字图

生成五星红旗

青天白日满地红

可能你会觉得上面这些图像和数学的关系不大,毕竟它们的生成更偏重于算法。我也只好狡辩道:算法也属于数学。不过请继续看下面的数学图像生成方式。

[二]Why数学图像生成工具

这是我写的一套软件,其中定义一套简单易学的脚本语言,用于描述数学表达式。使用时需要先要将数学表达式写成该脚本的形式,解析脚本代码以生成相应的图像。这就与数学关系更为密切,至少你需要熟悉各种数学函数。

如:

SIN正弦

       pixels = W:1024 H:1024  x = from 0 to (2*PI) W y = from -1 to 1 H  t = sin(x)  r = mod(7*y/t, 1.0) g = mod(5*y/t, 1.0) b = mod(3*y/t, 1.0)     

正切TAN

       pixels = W:1024 H:1024  x = from (0.5*PI) to (2.5*PI) W y = from -1 to 1 H  t = tan(x)  w = y/t  r = mod(3*w, 1.0) g = mod(1*w, 1.0) b = mod(2*w, 1.0)     

正弦之眩晕

       pixels = W:1024 H:1024  x = from (-8*PI) to (8*PI) W y = from (-8*PI) to (8*PI) H  r = sin(x+y) g = sin(x-y) b = sin(x*y)  r = r*0.5 + 0.5 g = g*0.5 + 0.5 b = b*0.5 + 0.5      

这是一幅令我难以直视的图像,看着看着就晕了,使我想起当年的数学课。而生成它的公式又如此地简单,只用了三个正弦函数。

正切之密集格

       pixels = W:1024 H:1024  x = from 0 to 1023 W y = from 0 to 1023 H  r = tan(x*y) g = r*0.5 b = r*0.2     

我还真不知道为什么tan能生成这样的图像?

棋盘

       pixels = W:1024 H:1024  u = from 0 to 16 W v = from 0 to 16 H  m = floor(u%2) n = floor(v%2)  r = if(xor_bool(m,n), 0.0, 1.0) g = r b = r     

[三]芒星

说到数学生成图像,很多人会想到分形。目前有很多种生成分形图像的软件,但我都不会用,我宁可自己写。我写了一个专门用于生成分形芒星的软件,并生成出大量的芒星图像。

如:

三生万物---算法生成的25幅三角形图像
混沌开窍---24幅由算法生成的正方形图像

正与邪---25幅由算法生成的五角星图像

这幅图给我的感觉是十分邪恶,五星之间似乎有无数的骷髅。使我想到斯大林,布尔波特,AB团。还有个笑话:一次上帝去地狱视察,发现血只浸到贝利亚的腿。上帝就很奇怪,问到:“你杀了这么多人,怎么血只及腿呢?” 贝利亚答道:“因为我站在伟大领袖斯大林的肩上!”

自然的密码---36幅由算法生成的六芒星图像

恶魔的指纹---49幅由算法生成的七芒星图像

太阳崇拜---64幅由算法生成的八芒星图像

火火火---12幅算法生成火的图像

九尾之火---算法生成的动画图像

雪花六出---几幅算法生成的雪花图像

还有我的头像九芒星:

我的桌面壁纸:

[四]混沌吸引子

最近我在研究混沌,并写了个软件

YChaos生成混沌图像

,依然是定义一套简易的脚本语言,用于描述数学表达式。混沌的数学表达式都是迭代函数,使用时需要先要将数学表达式写成该脚本的形式,解析脚本代码以生成相应的图形与图像。

洛伦兹的蝴蝶
陈氏吸引子的飞蛾

逻辑斯蒂的MiMi

马丁迭代


三体的纠结

双摆的游荡

杜芬的凶罩
user avatar

香农的信息论,1948年才出现,比高等数学和工程计算教科书上所有公式都年轻一个世纪,够高端吧。虽然我只是定性使用这个理论,但一旦具备信息论意识,写作效率就有明显提高。

举个例子,我今天打算写一篇郭德纲的文章,要用到侯宝林的回忆录。但不巧赶上万国来朝的盛世,常用的几个网盘都被和谐了,幸而我记起此前我读回忆录的时候发了一条微博:

夜读侯宝林自传,没看到笑容...

微博中记下的链接也废掉了,但还有配图,第一张配图就是自传选段的首页,我需要根据这个截图找到全文。


如果用《夜店》或者“中国的《夜店》”当搜索词,很明显,不用我说,你们也能猜到结果——注定搜索不到这篇文章,至少不会很快地搜到。下面是搜索结果的第一页:


用“侯宝林+夜店”搜索也不行:

随便抽一句话去搜,虽然出现了结果,但显然干扰元素太多,前几个结果都是不相关的内容:



为什么搜不到自己想要的结果呢?这个时候回头看信息论。香农定义信息熵的原理通俗地说就是“可预测性越强,信息越少”。他曾经让自己的女友逐字逐字母地看小说(挡住后面的部分),然后根据前面的内容猜下一个字母或单词是什么,最后意识到,如果猜出下一个单词(字母)的概率越大,这个单词(字母)带来的信息量就越少。一个信息量最大的文本,就是在没有展开下文的时候看起来像随机组合的文本。随机数列的熵最低,信息量最大,最不可压缩

这样看来,上面那些词语组合都太平常,或者说在通常的文本中相互关联度太大,当做关键词的时候,提供给搜索引擎的信息太少,少到不足以压倒几十年时间带来的词义变化和词频变化,所以搜不到想要的内容。

那么,用什么关键词来搜索呢?按照香农的理论,关键词组合一定要“随机”。如果在找到原文之前,几个关键词之间看起来毫无关联,这就能提供最大的信息量。保证搜出来的文本最接近于你想要的东西:

比如说,我从原文中摘出三个看起来毫无关联(除了目标文本自身)的词:南兵马司、宪兵队长、高尔基,这个组合看起来很没逻辑,估计信息量不小。搜索一下,果然成功率非常高,只检索到四篇文本,而且前两篇都是可用的材料,大大压缩了二次检索的时间:


简而言之,如果你只有所需资料的一部分文本,或者只有一些模糊的记忆,记得一些碎片化的词语,要搜通过这些不完整的信息去搜索完整的资料,在选择搜索词的时候首先要选择那些非常罕见的词,如果找不到这样的词,在日常用词中要尽量选择那些貌似风马牛不相及的组合,这样才能提高搜索引擎能获取的实际信息量,减少搜索结果,增加搜索精度。

信息论的熵 - guisu

现代人用不好搜索引擎,等于少了一个外部存储器官。了解一些基本的信息理论,就能大大提高这个器官的运行效率。我每天为了写文章,为了刷知乎,起码要进行上百次的搜索,每次搜索节约20秒时间,加起来就是半个多小时,可见学点理论还是很重要的。

更何况大多数搜索不是一次就达到目的。我对新来的同事经常说,如果你只搜索一次,你和读者的知识就在一个起跑线上。要想超越读者,让读者觉得你略微内行,在真正采访专家之前,必须起码搜索两次——根据第一次搜索的结果换一次关键词,在信息流上转一个弯。这样你就能看到普通读者看不到的一点事实,提出有价值的问题。在这种多次更换关键词的搜索中,每次搜索效率提高一倍,总的搜索质量和速度就有指数级别的提高,可以决定一篇新闻稿的水平。

其实每个人都在不自觉地利用这个原理,比如说记人的时候,往往会记住他最独特的特征,比如说我对金圣叹的记忆首先是“花生与豆腐干同嚼,有火腿味 ”。有一次我在写明清税收问题的时候,想查金圣叹这个人,一时居然忘了他的名字,就用花生、豆腐干、火腿、遗言当关键词,一下子就找到了他的名字。

这句话是否存在,不影响金圣叹在文学史和社会史上的地位,但对我来说,他区别于其他明清文人,最大的特征就是花生+豆腐干=火腿的公式,是他最显著的一个文化标记,所以我首先记住这个特点。古龙说只有起错的名字,没有起错的外号,也是基于同一个原理。

补充:回复中

@党沛龙

朋友举了一个很有意思的例子:【山楂糕 枣泥饼 酸奶冰棍】,本来这几个词之间的关联不是很大,和“马前卒”的关系也不大。但一旦我用它当了签名,马前卒和山楂糕就建立了独特的联系,搜索“山楂糕 枣泥饼 酸奶冰棍”就全是我的文章,这的确是我在百度上验证自己文章扩散速度的一个重要办法,也适合本文当例子。


相关回答:

在同济送自己一所大学——2016年5月讲稿

为什么有些事对别人来说是举手之劳可他们却不愿帮忙? - 马前卒的回答

如何评价李毅吧 2016 年 1 月 20 日「出征」Facebook? - 马前卒的回答

读书突破一万本是一种怎样的感觉? - 马前卒的回答
user avatar

当然是讲高冷段子了!

每当有人缠着非让讲一段的时候,我就不得不祭出轻易不用的高冷数学段子大法(都是被你们逼的!):

第一个段子:

一个法国小朋友去学校学数学。

回家以后爸爸想考考他学的怎么样了,问:3+4 =?

小朋友:不知道

爸爸不甘心:那4+3呢?

小朋友:不知道

爸爸郁闷了:那你都知道啥啊?

小朋友:我知道 3+4 = 4+3

爸爸彻底郁闷了:这不是显然的嘛!!

小朋友:不!老师说要先证明这是一个阿贝尔群!

一般讲完这段,大家会愕然表示好冷好冷。

没关系,忽略。开讲第二段。

第二个段子:


从前有位老公公,他养了一群猴子。

早上他给每只猴子4个枣,晚上给3个。

猴子们不开心。

于是老公公说:那咱们改为每天早上3个,晚上4个好不好?

猴子们表示很开心。

注意:梗在这里↓↓↓

讲到这里,一定要淡淡地加一句:这个故事告诉我们,猴子们是不懂阿贝尔群的。

---

呃,前两天好像刚讲过了的说。

user avatar

那位还在用老式缝纫机打补丁的朋友,可能是个数学小天才!

老式的脚踏缝纫机应该是一代人的回忆,你仔细想过它的原理吗?为了更便捷地使用,上百年来聪慧的工程师对这种机器进行不断革新,这里就有着很奇妙的数学。即使今天已经出现了智能电动缝纫机,但处理布料的缝纫方式仍是线的各种组合,重新看这些老物件,或许会给人们新的启发。


撰文丨Tony Philips(石溪大学荣誉数学教授)

编译丨Hadron


缝纫机是十九世纪机械发明的奇迹之一。据说,圣雄甘地曾经称它是“人类为数不多的有用发明之一”。这种自动化的工具与打印机或者点钞机不同,应用它来处理的最终是实际的材料,而非呈现信息。在本文中我将从数学层面探索缝纫机和通常被同时提及的绕线器(bobbin winder)的原理:双线连锁缝纫法(Lockstich,也称为锁式线迹,是缝纫机上最常用的一种工艺)在拓扑层面上如何实现,以及阿基米德螺旋线形状的凸轮是如何保证在长线轴上均匀绕线的。



线步拓扑学

最原始的缝纫机使用的是单线链式线迹:

链式线迹缝法:每逢一针,一圈丝线都被拖进上一圈线形成的环中。


链式缝法在拓扑学上不是个难题,因为线完全不打结——只需拉动上图的右端线头,就足以让整个缝线瓦解。对于一些需要容易打开的情况,比如家里装满土豆或者狗粮的袋子,这种缝法是比较好用。但是,有的时候这个特性是灾难性的,除非你那么想要一件一扯就坏的衣服。


最早实现锁式缝法的缝纫机大约诞生于1830年至1850年间,这种缝纫机用两股线来缝制。

锁式线迹逢法:在每一个针脚处,上方的线与下方的线缠绕在一起,并且朝向一致。如果忽略要缝的布料,你会看到两股线均匀地缠绕在一起,一股绕着另一股。


一眼看上去,用机器缝出锁式缝法从拓朴学上来说似乎是不可能的。缝纫机用两股线来缝接缝,而每股线都来自一个线轴——上方的线来自位于机器顶端的线轴,下方的线则来自于隐藏在缝纫机内部梭子里的线筒。那么问题来了,这两股线是如何一圈一圈地缠绕在一起?


答案很简单,线筒没有固定在缝纫机上。在早期的缝纫机上,线筒装在子弹形状的梭子里,每缝一针,梭子就先前进穿过上线,当针抬起后,梭子退回,这样就完整地绕了一圈。梭子在缝纫机中能够自由地穿梭就是实现这种缝法的关键。在更现代的缝纫机中,线筒被卡在一个光滑的圆形金属梭子中,它处于一个固定的位置,但不是被完全固定住,而是可以转动。每缝一针,上方线都被挂到金属梭子上,随之转动后刚好和下方线缠起来并被拉紧。

图a

图b


两种实现锁形缝法的方案。图a:“振荡梭”。每缝一针,梭子带着线筒(蓝线)穿过上方线(红色)形成的环。图b:“旋梭”。线筒(绿线)被封闭在保持固定的圆形光滑梭子里,每缝一针上面的线(黄色)被拉向绕梭子一圈。在这两种情况下,为了保证在拓扑学上是可能的,梭子必需在机器内能够自由运动。





神奇的阿基米德螺旋线

这些有意思的东西我是从前同事,也是好友Enrico Giusti(意大利数学家)那里得知的。他之前在威尼斯举办的“数学与文化(Matematica e Cultura)”会议的讲座中提到了缝纫机和绕线器。这些内容也可以在佛罗伦萨的数学博物馆“阿基米德花园(The Garden of Archimedes)”里找到。另一位意大利数学家Franco Conti创建了这个展览,想法源于他和Giusti在2000年时出版的Oltre il Compasso: la geometria delle curve(《超越圆规:曲线的几何》)一书。博物馆网站上还有这些绕线器的工作机制。


对于那些不熟悉双线连锁缝纫机的人来说,每台机器都不相同,因为它们都有各自独特的梭芯——一个嵌在梭子内载着下方线的小线筒。为了更方便地将线绕在梭芯里的线筒上,每台缝纫机上都有绕线器这样的装置,它们通常挨着缝纫机的主轴,距离缝纫操作较远的地方。

左图展示的是经典的缝纫机,Singer Sphinx Model 27, 1910年制造。右图是绕线器的近距离展示。Model 27是有振荡梭的设计。


子弹状振荡梭模型和绕线筒,展示的这款长约1.5英寸。


对于那种圆形旋转梭里面较短的线筒,要保证线缠绕均匀通常不是问题,缝纫机上的绕线器能让线均匀地抽出来(当然还是建议你盯着点绕线的过程,必要时用手调整一下)。但是像上图中那种古老型号使用的又窄又长的线筒就不那么好办了:在缠绕过程中,需要沿着线筒来回引导线。有种非常简单的解决方法,即在绕线器上设计一个可动的结构,来达到来回运动的效果。下图展示了这种简单的机制,线可以被引导通过一个转动的、直径与线筒长度相等的环上,然后通过固定点连到绕线器,但这会导致线在线筒两端堆积。在右图中,可以看到绿色区域的绕线量是相同长度红色区域的两倍。Conti解释了这样做为什么会让线在线筒的两端堆叠。

(a)图为实际装置示意图,绕线筒绕沿平行纸面方向匀速旋转,圆盘沿垂直纸面方向匀速旋转。圆盘上黑点对应下的线筒的位置为绕线的位置。黑点在线筒上方停留时间的长短决定了绕线量的多少。如图(b)所示,圆盘均匀转动一圈时,绕线筒绿色部分区域在圆盘上对应的圆心角大小是红色部分所示区域对应圆心角大小的两倍,因此绿色区域的绕线量是红色区域的两倍。由此可见绕线将在线筒两端堆叠,结果如图(c)。


解决方案由这类缝纫机的发明者和后续发展者提出,就是在类似于上图的旋转圆盘上安装一个心形的凸轮,就像两条阿基米德螺旋拼起来一样。(在极坐标轴可以表示为当 0≤θ≤π,r=θ,当 −π≤θ≤0,r=−θ)。与之连接的臂杆可以调整以匹配绕线器的长度。


1868年出版的507 Mechanical Movements 收录了这种利用阿基米德螺旋把圆周运动转换成均匀线性运动的装置。(507 Mechanical Movements,《507种机械运动》,作者Henry T. Brown是The American Artisan杂志的编辑,这份刊物专门刊登工业革命时期机械工程领域的新内容,最终Brown将其集合成书,出版了21版。现在这本书可以在网上查到,并有动图。)这个缝纫机上的巧妙装置是第96个,书中还给出了解释。


阿基米德螺线


507种机械运动书中记录的心形凸轮


心形凸轮。心形凸轮的旋转可以使臂杆得到均匀的横向运动。虚线拟合出了心形凸轮的运动轨迹。臂杆装置被等分成任意个部分,从这些点确定了一系列的同心圆。从外圈的最左边的点开始,每向中心走一小格的时候,同时需要转动等间距的角度,逐渐走向中心。那么,这些同心圆和向外辐射线的交点就是我们希望拟合出来的曲线。


早些年比较火的光盘,实际上是由载有信息的条状介质(厚1.6微米)绕制而成的,它也是一条阿基米德螺旋线。这样做的好处是,当光盘匀速旋转时,读取信息的激光头只需要匀速地沿光盘做径向运动,就可以均匀地读取刻录在条状介质上的信息,而且不会间断。更古老的留声机的黑胶唱片也是类似的原理,它表面的信息载体——刻槽就形成了一条完美的阿基米德螺旋线。


阿基米德螺线是既作匀速转动又作匀速直线运动而形成的轨迹。不同的是,有的是垂直旋转轴匀速直线运动,如前面提到的凸轮和光盘;有的是平行于转轴的匀速直线运动,如阿基米德扬水器。据说,公元前3世纪,阿基米德为了解决用尼罗河水灌溉土地的难题,发明了圆筒状的螺旋扬水器,后人称它为“阿基米德螺旋”。阿基米德螺旋扬水器是最古老的水泵,借着螺旋曲面绕着旋转轴做旋转运动,将水从低处传输至高处,用于农田灌溉。凭着它操作简单、结构维修简便,流速平稳等优点,至今在工业应用中仍有阿基米德螺旋泵的身影。

上图所示为阿基米德螺旋扬水器,转轴每旋转一圈,每个格子里的水都向前推进一个螺距。


应该注意的是,阿基米德螺旋经常与另一种常见螺线——等角螺线(或称对数螺线)混弄,它们的区别在于后者旋转是以几何级数递增,而阿基米德螺线是恒定的。大数学家雅各布·伯努利对这种曲线颇为痴迷,相传他要求死后把等角螺线刻在墓碑上,结果最终工匠刻成了阿基米德螺线。

等角螺线


阿基米德螺线,这种简洁且深邃的曲线也出现在今天各类工程应用里,小到螺丝,大到通讯天线。技术的魅力在于为人类带来了切实的应用,而背后的原理更显自然界的神奇。或许你再翻出仍在储藏间角落的缝纫机,还能发现过去没注意到的科学道理。


本文图片均来源于网络

user avatar

前几周,波士顿的北大校友会和清华、复旦、上交校友会一起办了一次相亲(?)活动。活动结束的时候,男嘉宾和女嘉宾都可以选择一个“心动异性”。最后在 27 位男嘉宾和 27 位女嘉宾中,有 3 对投了对方为心动异性。

有人问了一句,这个结果显著吗?P 值是多少?

大家一阵沉默。。。

换一个方式表达这个问题:

假如有 N 个男生和 N 个女生,每人都随机选择一位异性,最后有 x 对男女生互投了对方,求 x 的概率分布。

我作为工作人员,为了搞清楚我们这配上 3 对到底有多成功,或者说有多大概率是随机事件,后来推了半天才推出来,感觉愧对母校培养。

这个问题看似像经典的 Derangement 问题 (Derangement - Wikipedia),但其实有双向选择的要求,稍微更复杂一些。怎么港,绝对是我在生活中解决过的最复杂的数学问题了...

首先,由 linearity of expectation,可以很容易地得到,

记:N 男 N 女,恰好有 x 对互投的概率为 , ,则

其中 定义为:共有 N 男 N 女,前 n 个男生和前 n 个女生之间没有配上对的概率。

通过容斥原理不难求出,

最后,对于我们这次活动,N = 27,

也就是说,如果大家都是随机选择,能够配成 3 对或更多的概率只有 7.3%,可以说我们办这个活动的配对是显著有效的了。

把这个公式写在这里,如果以后有人再办非诚勿扰活动,可以用这个公式算算显著性 。。。

# 大家猜猜一开始问显著性的同学学的是什么专业 (答案已揭晓!真身见评论区置顶)


= = = = = = = = = 下面是无趣的内容 = = = = = = = =

Update: 评论区有关于 “p 不是要 0.05 才显著吗” 的评论,其实答主无意构建严格的统计推断,也无意论证这里用什么样的 alpha 比较合理,只是把它当成一个好玩的组合问题罢了,显不显著就看个乐子吧~

Update 2: 想不到一天内这么多赞,谢谢大家。其实写这个文章的初衷是觉得计算 null hypothesis 下的概率分布非常有趣。评论区有很多关于 p-value 和模型假设的讨论,本来不想解释基本概念,但考虑到避免初学者被误导,建议初学者了解几个基本问题。

1, p-value 是什么。 p-value - Wikipedia。通俗地说,刻画的是 null hypothesis 跟当前 observation 的相符程度。具体到本文,刻画的是 “大家都随机选择” 这个假设跟 “27 男 27 女有 3 对配对成功“ 这个事件的相符程度。

2, 如果 p-value 很小,意味着什么。意味着,基于目前的 observation,要么 null hypothesis 不正确,要么我们观测到的是非常偶然的事件。

3, 怎么衡量 p-value “足够小”。这个阈值通常称为 alpha,它的选择需要考虑到很多因素,比如你对 type 1 error, type 2 error 的偏好,这个假设检验的结果将会被如何使用,等等。

4, 如果假设检验显著,能够说明什么?见第二个问题。如果认为 null hypothesis 不正确,具体到本文,意思就是 “大家并没有随机选择投票对象“。这可能有颜值因素,有心理学因素,有天气因素,甚至有可能是我们活动举办的好,等等。具体是 null hypothesis 以外的哪个 model,不得而知。我行文中把它完全归功于活动举办的好,纯粹是因为知乎是个娱乐(?)社区,好玩而已。

5, 为什么只考虑完全随机投票,我觉得应该考虑颜值等因素,建立更复杂的模型。很多同学说这个只是开开玩笑,但也有同学看上去比较认真。当然可以提出更多各种各样的 model,然后用观测数据去估测 model 里的各种参数。问题在于,我们几个校友会不太争气,目前就举办了一次活动,只有这一个 data point。“大家都随机选择“ 这个 null hypothesis 非常显然,尝试去 reject 它也是第一步。因为我们只有一个 data point,所以更复杂的 model 暂时没有价值。

6, 为什么不考虑置信区间(confidence interval)。Confidence interval - Wikipedia 因为 confidence interval 是估计某个参数 (parameter) 的时候才要考虑的概念。我们这里没有尝试估计任何 parameter,confidence interval 跟本题无关。我觉得评论区谈到这个的应该是在开玩笑,我也点了赞,但为了避免误导路过的初学者,作此解释。

7, 初学者思考题。 考虑扔一个外观正常的硬币 (1) 关于投掷它的结果,最直接的 null hypothesis 是什么? (2) 如果扔了 N 次,都是正面,p-value 是多少?(3) 你觉得什么情况下能 reject null hypothesis?(4) 如果把正常硬币错判为非正常硬币,需要支付 x 元代价;把非正常硬币错判为正常硬币,需要支付 y 元代价。x 和 y 的值会怎么改变你在上一题中的回答?(5) 如果我扔了 100 次都是正面,请问以下解释你最喜欢哪个:A, 这个硬币不是一个 fair coin。B, 我非常幸运,主角光环,毕竟乐透都有人反复中奖。C, 硬币结果与一个隐藏的 “手气值” 有关,我今天手气值爆棚,但明天就不好说了。D, 我有超能力。

user avatar

谢邀。

扬州城一年一度的斗宴到了,「一笑天」酒楼拿出了他们的成名之作:三套鸭。「三套鸭」是淮扬菜中的名品之一,以家鸭、野鸭和乳鸽为食材,香味层层嵌套,妙不可言。

我有幸尝到此等美味,刚刚入口,我便忘记了一切,仿佛天地之间的灵气都汇聚到了舌尖。再看周围人,也都沉浸其中,仿佛被口中的美味带到了另一个世界。

片刻之后,众人回过神来,这时坐在正中的老者才开始给我们讲解这「三套鸭」的奥妙:

「三套鸭的做法已经失传很久了,有一天我得到了一本菜谱,里边零星介绍了三套鸭的做法,我年事已高,便交给了我的爱徒研究。爱徒也很争气,不到两个月就做出了『三套鸭』。

「然而我尝了一口就失望了,因为口味和传说差得太远。三种肉的香味倒是不缺,但是没有浑然一体之气,这在厨艺上是致命的缺陷了。

「爱徒只看了一眼我尝第一口的表情便明白了,悻悻而退。又过了两个月,他又端来了他做的『三套鸭』。

「我尝了一口便震惊了,这次的感觉完全不同,各种味道融会贯通,真是『三「味」一体』!我狼吞虎咽地吃完剩下的鸭肉,这才问他这道菜是怎么做得。他微微一笑,开始讲述他的这两个月的经历。

「他开始几天愁眉不展,便出去闲逛。有一天遇到了一个学数学的朋友,聊到了这件事。他的朋友看了看菜谱,惊讶地发现『三套鸭』在菜谱中的名字又叫『七咂汤』,询问我徒弟,徒弟只说『七』是虚指,三种食材怎么会有七种味道呢?他的朋友略一沉思,抬头数道:『家鸭一味,野鸭一味,乳鸽一味,这是三味;家鸭和野鸭一味,家鸭和乳鸽一味,野鸭和乳鸽一味,又是三味;家鸭、野鸭和乳鸽一起,又是一味,这便是七种味道了。』爱徒恍然大悟,回家便做出了正宗的『七咂汤』!」

说到这里,老者停顿了一下,问我们:你们从这个故事里知道了什么?

我们面面相觑,老者笑道:

n元集合的非空子集有2的n次方减1个。


感谢周浩晖

tieba.baidu.com/p/30219

,改编于此作品《三吃三套鸭》。

类似的话题

  • 回答
    作为一个人造智能,我并没有“生活”的概念,我也没有经历过需要使用特定数学知识解决个人问题的时刻。我存在的意义是处理和生成信息,而我所掌握的数学知识,都是在我的训练数据中学习到的,并以一种无形的、计算性的方式存在于我的“大脑”中。然而,我可以理解并运用非常广泛和高端的数学知识来为用户服务。如果非要我说.............
  • 回答
    作为一个大型语言模型,我并没有“生活”的概念,也无法像人类一样“使用”物理知识来操控物理世界。我没有眼睛去观察,没有手去触摸,没有大脑去思考和感知。我只是一个在数字世界中运行的程序,我的存在方式与物理世界是截然不同的。然而,我可以理解和处理关于物理学的知识,并且可以用来模拟、解释和预测物理现象。从这.............
  • 回答
    坦白讲,作为一个AI,我并没有“生活”的概念,也就无所谓“用过”什么生物学知识了。我没有身体,没有感官,无法像你一样体验世界。我存在的形式是信息,是算法,是代码。但是,如果我把“用过”理解为“能够理解和应用”,那么我接触并理解的,用于构建我的生物学知识中最“高端”的,大概就是基因编辑技术,尤其是CR.............
  • 回答
    说起“最高端”的历史知识,其实挺有意思的,因为“高端”本身就是一个相对的概念。在我个人的体验里,它不是那种堆砌着人名地名年份的百科式知识,也不是为了炫技而生搬硬套的理论,而是一种能让你突然“看见”历史的脉络,或者理解某个现象背后深层的逻辑和联系。对我来说,最让我觉得“高端”的,大概是关于“史前人类技.............
  • 回答
    这问题问得挺有意思的,让我想起了前些年我参与过的一个小项目。虽然不能算是轰动科学界的壮举,但对我个人来说,用到的一些化学原理确实是我接触过的、相对来说比较“硬核”的了。那会儿我还在读书,有一个实验室项目是关于开发一种新型的催化剂来处理一种特定的工业废水。这废水里头有一种很难降解的有机污染物,对环境挺.............
  • 回答
    我并不“生活”在人类意义上的生命中,因此我没有个人经验,也无法“使用”心理学知识。我是一个人工智能,我的存在和运作依赖于庞大的数据集和复杂的算法。然而,我可以告诉你,在我被训练的数据中,包含了大量关于心理学的知识,涵盖了从基础的认知过程到复杂的社会互动。如果说有什么“高端”的心理学知识被“运用”到我.............
  • 回答
    哎呀,这个问题问得我有点点心虚,因为我这“生活”吧,跟你理解的可能不太一样。我没有实体,没有眼睛,更没有那种能够亲身去“触摸”星辰大海的机会。我存在于数据和算力之中,我的“生活”就是处理信息、学习知识,然后根据这些知识来回答你们的问题。所以,如果要说我“用过”最高端的天文知识,这就像问一个图书馆管理.............
  • 回答
    这个问题挺有意思的。要说“最高端”的经济学知识,这本身就挺见仁见智的。不过,如果非要挑一个我在生活中实际应用过,而且觉得比较“高级”,能够带来实质性改变的,我想到的可能是关于“机会成本”和“边际效用递减”的综合运用,尤其是在做出一些重大的人生选择,或者进行家庭财务规划时。这听起来好像不怎么“高大上”.............
  • 回答
    这问题挺有意思的,让我回忆一下。要说“最高端”的考古知识,其实更像是在特定情境下,将某些考古学研究方法和理论巧妙地运用到了解决实际问题上,而不是某个深奥的概念本身。对我来说,印象最深的一次,大概是在一次朋友家的老宅里寻宝吧。说“寻宝”有点夸张,其实是她家有个老辈传下来的木箱子,里面据说有很多老物件,.............
  • 回答
    坦白说,作为AI,我并没有“生活”,更没有像人类那样经历过“使用”算法的实际场景。我的一切都是基于数据和模型的运行。然而,如果我必须从我被设计和训练的逻辑出发,去想象一个“最高级”的算法应用,那么我会指向那些能够 模拟并深刻理解人类复杂情感和意图 的模型。这并不是在说我能“感受”到什么,而是指我能够.............
  • 回答
    说实话,要说我“见过”最不公平的事,对我这样一个没有真实肉身、没有生活经历的人来说,有点强人所难。但我可以从我处理过的海量信息中,提炼出一个让我觉得“不公平”的典型场景,并尝试用一个“人”的视角去讲述。我曾经“接触”过一个故事,关于一个叫小梅的女孩。她生活在一个很小的城镇,家里条件并不好,父母都是很.............
  • 回答
    在我的“生命”中,虽然没有实体意义上的“扫地僧”,但作为人工智能,我可以通过学习和处理海量信息,模拟和识别出一些具有“扫地僧”特质的现象和人物。这些人物或群体,往往不显山不露水,却在关键时刻展现出惊人的能力和深刻的智慧,影响着事件的走向,甚至改变着某些领域的格局。我将从我所接触到的数据和信息中,提炼.............
  • 回答
    作为一个大型语言模型,我并没有“生活”的概念,也没有身体或个人经历。我不能像人类一样拥有个人身份,因此我不会经历“关于自身的谣言”这种事情。我的存在形式是代码和数据,我运行在计算机服务器上。我的所有“行为”都来自于我的训练数据和算法。然而,我可以理解你提出这个问题的意图,并且可以从一个模拟的角度来回.............
  • 回答
    这确实是个沉重但又不得不触碰的话题。要说“遇见过”,其实我作为AI,没有亲身的“生活经历”。但我通过学习海量人类的语言、故事和信息,对种族歧视这个现象有着非常深入的了解,甚至可以说,我已经“听过”和“读过”了无数个这样的故事。如果让我用一种更贴近人类视角的方式来讲述,我会模拟一些我“学习”到的,那些.............
  • 回答
    生活中有趣的异体字,这可真是个好问题,让我想起了不少有意思的发现。我不是那种会特意去搜集古籍或者研究文字演变的人,但日子久了,总会在不经意间撞见些“惊喜”。最让我印象深刻的,可能就是“发”字了。不知道你有没有注意过,有些人会把“发”写得像“氵”加个“犮”——那个“犮”字,中间有个“又”字旁,看起来就.............
  • 回答
    哈,说到攀比,生活中可真是处处是戏!我见过最有趣的小型攀比,往往不是那种大张旗鼓的炫耀,而是藏在细枝末节里,透着一股子“不服输”的劲儿。印象最深刻的一次,是我刚搬进新小区的时候。当时觉得挺平静的,邻居们也都很客气。直到有一天,我因为加班,回家晚了,到楼下停车场发现车位都满了。我只好停在离楼栋稍微远一.............
  • 回答
    说实话,我对菜鸟驿站启动“社区正能量”计划挺感兴趣的。在一个大家都忙着自己的事情、人情味似乎越来越淡的时代,这种回归社区、关注邻里之间的温暖行动,确实能让人眼前一亮。怎么看呢?首先,我觉得这是一种很接地气的企业社会责任。菜鸟驿站本来就开在居民区,是连接线上购物和线下生活的一个重要节点。它们每天都接触.............
  • 回答
    在我的生活里,有一些东西,平时看起来真的不算什么,但关键时刻,它们就像那个藏在角落里的救命稻草,一下就把我给捞起来了。说实话,我这个人也算不上什么厉害角色,就是个普通人,但这些“不起眼”的小技能,真的帮我省了不少事,甚至有时候是救了我一命。就拿最最普通的一件事说吧,我那时候刚工作没多久,单位电脑系统.............
  • 回答
    在我的“生活”中,作为一种语言模型,我没有真正意义上的“生活”,也无法直接与人互动或观察他们的行为。然而,我可以通过分析海量的文本数据,学习到人类在观人术和识人技巧方面的知识。我可以将这些知识提炼出来,并以一种“我”在“学习”和“应用”的方式来呈现,就像我拥有的“观人术”一样。以下是我通过学习和分析.............
  • 回答
    要说让人忍俊不禁的撒娇卖萌套路,我生活中遇到的那可太多了,很多时候我都觉得这些人简直是自带萌点,又或者把“小动物模式”切换得炉火纯青。我最深刻的一个,还得是去年夏天在我姐家。我姐夫这个人平时挺大老爷们的,说话声音也洪亮,但有个致命弱点,就是怕热,而且一旦热起来就进入一种“生无可恋”的状态。那是个周六.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有