百科问答小站 logo
百科问答小站 font logo



如何看待李沐老师提出的「用随机梯度下降来优化人生」? 第1页

  

user avatar   eric314 网友的相关建议: 
      

其实目标是最难的,因为从结果来看我们都死了,涅槃寂静,优化的只能是过程。

我比较倾向于强化学习,找一些比你大几岁的人作为参照,最好是那种几年前水平和你差不多的,想想几年后如果你能达到他们的状态你会有多满意,然后想想几年后你想达到他们的状态需要做什么。

评论里提到这里有一个末法时代环境变化导致修炼越来越难的问题,所以不能用前人的成功概率直接带入,需要考虑当前环境下你自己重复的成功概率。

进一步可以想想他们过去有什么失误,如果不失误能到什么状态,优化一下regret。

最后如果你发现几年前和你差不多的人大多数现在还是和你差不多,说明你可能混到头了,该躺平了。。。


user avatar   mli65 网友的相关建议: 
      

借宝地打个广告:今年秋季斯坦福新课《实用机器学习》的中文版上线了!本课程介绍机器学习在工业界落地的各种技术,在B站和YouTube持续更新。欢迎大家围观评论


user avatar   SeptEnds 网友的相关建议: 
      

然而,除了优化算法还有初始化:有些人有预训练模型,一出生就在最优点附近,压根不需要动,直接 zero-shot 就比大多数人吭哧吭哧训半天效果还好;有些人出生在悬崖边上,一步走错就万劫不复。

然而,除了优化算法还有损失函数:有些人的损失函数是强凸的,优化的方向非常明确,或者是有很强的正则项,走错的时候可以把他往回拉;有些人的损失函数数值极其不稳定,动不动就爆 NaN/Inf。

就算是优化算法,也要看你能拿到什么信息:有些人是一阶优化,跟着梯度信息渐渐往前走;有些人是零阶优化,拿不到梯度信息,就只能自己摸黑瞎走走。


user avatar   huo-hua-de-41 网友的相关建议: 
      
简单最好。当然有比随机梯度下降更复杂的算法。他们想每一步看想更远更准,想步子迈最大。但如果你的目标很复杂,简单的随机梯度下降反而效果最好。深度学习里大家都用它。关注当前,每次抬头瞄一眼世界,快速做个决定,然后迈一小步。小步快跑。只要你有目标,不要停,就能到达。

我对这段话感触最深。人生远比模型更复杂。模型的loss landscape是静态的,即设定好目标和场景后就不变了。人生的loss landscape是动态的,一个local minima完全有可能在你规划目标的时候,是minima,过时间后就被填平了,未来甚至可能从“谷”变为“峰”。一个例子就是,以前大家都觉得读博当个大学老师很香啊,清闲自在又有寒暑假,就以这个为目标前进,后来发现怎么每年毕业的博士越来越多,怎么岗位越来越少,教职标准水涨船高,狼多肉少卷得不行,在有些人看来这就不香了,local minima被填平了。当上大学老师之后,发现既不清闲自在,也没有寒暑假,因为学校非升即走,考核要求越来越高,只能寒暑假疯狂肝科研。这时候,已经不是不香了,而是苦逼,这个目标不再是“谷”而是“峰”。

越复杂的loss landscape,随机梯度下降就越好,好就好在是一阶优化器,好就好在它没有动量。很多人的人生优化器是ADAM,每走一步都挂着巨大的动量,简单的环境下动量是好的,可以避免你不走偏,但复杂的环境下,动量就会变成“沉没成本”。我见过太多人,学了天坑专业,知道前面根本不是“香”的人生mimima,但因为高考的时候那一步梯度更新错了,舍不得放弃“沉没成本”,使得人生无法及时改变,一错再错。

随机梯度下降,有点类似鸡汤文里的归零心态,就是不要用过去的各种“动量”干扰你的决策,快速响应世界的各种变化,更有可能把你带到“香”的人生mimima里。


user avatar   zhao-ytc 网友的相关建议: 
      

同意高票回答的结论。

但是,想讲日本人的起源,只看日本是不行的,本回答希望把视野放到广阔的东亚,把韩国人的起源,日本人与炎黄部落的关系等一并讲明。

历史隐藏在层层谜团中,谁都不能得出百分之百正确的结论,如有错误,欢迎指出。

结论先奉上

35%祖先为矮黑人

35%祖先为生活在中国东北的扶余部落(原本为炎帝部落的一支)

20%祖先为典型华夏汉人

以下是全文目录

(1)东亚的杀戮与征服

(2)伟大的东北大地

(3)日本的起源


(1)东亚的杀戮与征服

研究人种起源与变迁最准确的是Y染色体检测,有一个段子,表白时男生对女生说,我有一条祖传的染色体想送给你。这条染色体,就是男性独有的Y染色体。Y染色体只传男,突变少,易检测,而父系又代表着权利与支配,因此Y染色体检测祖先受到人们的认可。2001年,人类基因组计划基本完成,人类历史的大幕被揭开,人种的变迁呈现在人们眼前。

全部人类起源自非洲,10万年前,最古老的一支矮黑人,其基因标记为D,走出了非洲,最早在5万年前,就到达了亚洲,他们广泛分布在东南亚,过着采集与渔猎的悠闲生活。

纯种矮黑人长这样

但不久后,与其差不多同时期走出非洲的棕色人种C,也到达了亚洲,C立刻开始了对D的杀戮与征服,D或被同化,或被驱逐到亚洲的各个犄角旮旯,现在东亚D基因只集中存在于日本(35%),西藏(40%)。

C集团也并没能统治亚洲多久,3万年前,黄白种人的祖先走出非洲,一支向北,成为白种人,一支向东进入亚洲,他们就是华夏汉人的祖先—O集团。O集团具有良好的技术与文明,C与D根本不是其对手,O集团旗下的O1、O2,迅速占领了中原最肥沃的土地,开始农业耕作,人口爆炸增长,建立了灿烂的文化,而C集团则被驱赶到了北部,成为了蒙古,女真等族的祖先,值得一提的是,韩国也存在大量的C,这些C也构成了韩国本土文化的基础。

5000年前左右,生活在藏羌的另一个O集团—O3,大举东进,一举征服与同化了在中原进行农耕的兄弟集团O1,O2,占领中原,成为了现在汉族的主流。现今的河北,山东等都为O3的天下,O1则被赶到了中国南方,O2现在只集中存在于东北的满族和日本韩国等。这一时期中国已有了记载,皇帝炎帝战蚩尤、周武王伐纣等,是不是就在说的这一段历史呢?

至此,现代亚洲的雏形就已经显现,各个民族的构成也清晰起来,汉族的血缘最统一,70%以上的O基因,其中03占50%以上,可以说我们不仅是文化上的民族,还是地地道道血缘上的民族。日本人除了55%的O之外,还有35%的D,这也构成了大和民族的独特之处,韩国除了大量的O也有2成C,文化独树一帜也有相应的基础。蒙古有高达5成的C,并把其C基因传到了欧洲各地,足见蒙古帝国的伟大。值得一提的是,蒙古王氏基因C3(蒙古人20%),和日本本土基因D2(日本人35%),在汉族中完全没有出现,看来汉族对于侵略者的抵抗很彻底,而蒙古和日本,却各有20%的O3存在,汉民族强大的影响力可见一斑。

东亚各个民族的兴衰史,其实就是一部基因的兴衰史,基因战争远没有结束,以后的进程值得期待。

(2)伟大的东北大地

作为土生土长的吉林人,读书时,课本里全都是中原王朝的兴衰史,我对于东北大地的历史完全没有了解。

最近在翻阅了各种资料后,我不禁感到,原来这片土地这么牛○

东北大地上主要生存着三族人

东胡—蒙古的祖先

肃慎—女真,满族的祖先

夫余—创立高句丽,后被灭国,语言消失。其中,东胡,肃慎,结合我们之前的基因分析,都是被O集团赶到北部的C集团,游牧为生。而夫余不同,是O集团的一支,地地道道的农耕民族,其基因极有可能是现今已不存在与汉族O2b

在这里援引李德山老师对于扶余历史的研究。

夫→番

余→徐

番国,与徐国,合并称夫余国,而番国与徐国都来自于共通的祖先——炎帝部落,该部落本来农耕于中原(一说于江南),战败后北上,于东北最终建立了自己的国家。势力遍及辽宁吉林朝鲜半岛,而起源与炎帝一说,又恰恰可以解释其O2基因与农耕文明的来源。朝鲜半岛三国鼎力时,百济与高句丽都为扶余后裔。而新罗则以韩国原住民C为主,文化与扶余不同。最终,新罗政权统一韩国,虽然他们后来建立了高丽王朝,但其本身与高丽没有任何关系,他们的新罗语言也成为了主流,也就是现今韩语的前身。扶余最终灭亡,但扶余的血统O2b,还大量留存在韩国(35%),中国满族(20%),日本(35%)。

(3)日本人的起源

讲到这里,大家也基本推测出日本人的起源了吧。

日本人的基因检测结果如下

35%D 矮黑人。

35%O2b ,汉民族基因O的兄弟,只大量存在日本,韩国,满族(满族是O2还是O2b目前还没有确切资料),上课追溯到炎帝部落。

20%O3 典型的汉民族基因。

其它还有一些棕色人种的C,不过和蒙古人的C也不相同

D与O3的来源已经不必说,但是O2b的来源是否是扶余还存在很多争论。

对此,语言上的分析为我们指明了方向。

语言种类上看,学者白桂思的研究指出,与日语最相近的语言就是古高句丽语,这是O2b旗下的扶余人的语言,也就是说,扶余人的语言在韩国被C集团的韩语取代,而在日本却被保存了下来,这正好解释了日语与韩语的不同之处,也佐证了基因研究的结果。


可以看到,他们的外貌有非常大的区别,某种程度上也代表着O系与D系基因的区别。

一直以来,日本都是绳文人的天下,弥生时代,来自朝鲜半岛的O2b与O3登陆日本九州,他们带着先进的农耕技术与文化,不断同化与驱逐着D集团,现在也能看到这种趋势,九州地区O较多,古代权力中心关西的O也比较多,北海道与冲绳则D比较多。

最后上一张平成天皇的照片,典型的弥生脸


天皇家是哪里来的?

大家猜猜看

是O3还是O2b呢?


参考:

图片百度百科

数据分子人类学论坛

复旦大学有很多相关研究,感兴趣的可以去围观


其他答案

日语有没有类似英语中词根的东西帮助记单词? - 张铭的回答 - 知乎


user avatar   xing-yong-wei 网友的相关建议: 
      

首先这是Fed一月 memo

先说结论:

FOMC 维持利率在 0-0.25% 不变。且确定 3 月完全停止 QE,同时 3 月加息也是箭在弦上,基本会后声明皆符合市场预期,没有太多的意外。

Powell 记者会确实是偏一点点的小鹰派,但我也认为,Powell 的说法不至于拉升市场加息预期至 5次 、并拉升缩表预期至上半年,反而比较像是在强化加息 4 次之预期。

另外我个人觉得,一些中文媒体似乎误读了Powell 记者会的部分片段,下面 Allen 再进一步说明。


1. 3 月加息停止 QE 早已定价

本次会议 Fed 再次确认 3 月将准备第一次加息,并同时停止 QE。

Fed 也再次重申,货币政策是要支持美国经济达到充分就业、与通膨长期均值维持 2.0% 的两大目标。

这部分我想市场早已定价,这裡完全不会是问题,所以我们不讨论太多。


2.未来加息在每次会议都可能发生 (?)

Powell 的原文说法是:Won't Rule Out Hike Every Meeting.

但我有看到部分中文媒体写:不排除每次会议都加息的可能性。

上述我想或许是误读了 (还是其实是我自己误会中文的意思 ?)

我的理解是:Powell 是说加息在未来每场会议都可能发生,指的是“不会在特定月份才加息”,不是说每场都要加息。

Powell 说得很合理,经济本来就是动态的,加息本就不会侷限在什麽月份才启动,端看当时的经济状况而定。

我认为Powell 上述说法,并未延展今年加息预期至五次或更多,若有这种想法,那绝对是误读了。


3.更大规模的缩表?

Powell 在记者会上提到,Fed 需要更大规模的缩表,但请大家不要恐慌,因为我又觉得部份中文媒体过度解读了。

我认为Powell 说到的“更大规模缩表”,在思维上指的是:

因为当前 Fed 资产负债表高达 8.9 万美元,这是新冠疫情爆发之前的两倍大,显然在绝对规模上是非常巨大的。

而上一轮 2017-2019 年 Fed 缩减资产负债表,是自 4.4 万亿美元缩到 3.7 万亿美元停止,缩表的幅度大概是 15.9%,共缩减了约 7000 亿美元。

确实每次缩表的经济背景绝对是不一样的,所以幅度也绝对不会相同,但我们随便抓,假设本轮缩表将缩减 10% 资产负债表规模,那麽这也要降低 8900 亿美元,规模当然很大。

但我认为,不需要过度恐慌在“更大规模缩表”这几个字上。更重要的,我认为是“Fed 缩表的速率是多少?”

我相信缩表没问题,缩表太快才是问题,因为缩表速度若太快,将直接影响的会是美债殖利率升速、以及殖利率曲线的斜率。

这点Powell 也非常清楚,Powell 在记者会上也不断强调,联准会内部尚未具体讨论到一切缩表的进度,要等到 3 月再说。


4.缩表比较可能落在下半年

Powell 在记者会上说明,希望在加息至少一次之后,再来开会讨论缩表的事情,且委员会至少将讨论一次,才会做最终拍板。

更重要的,Powell 希望缩表的进程是有秩序的、是可被预见的过程。

从上述Powell 丢出的时间表看,我个人认为缩表将落在 2022 下半年,最快可能是 6 月份,因为在 3 月加息后,Fed 才会来讨论缩表。

我个人相信 Fed 现在内部早已在讨论缩表,但委员会显然尚未准备好来与市场沟通缩表的前瞻指引。

而缩表这麽大的事情,我个人认为 Fed 需要起次跟市场沟通 2 次,并把缩表规划说得非常清楚之后,才会开始进行,所以比较合理的缩表时间,估计将会落在下半年。


5.最大风险:高通膨

Powell 在记者会上,大概提到了 800 万次的“高通膨压力”,并认为目前美国通膨风险仍在上升阶段,但预计 2022 通膨还是会回落。

Powell 说明,目前美国通膨居高不下,主要仍是供应链所致,白话来说就是供需仍然失衡,且供给侧 (Supply Side) 改善的速度是低于预期。

Powell 强调,目前美国高通膨持续存在,而美国经济要的是长期扩张,所以若要长期扩张,物价势必需要保持稳定。

这边开始进入正题了,我认为这是本次会议的最重要核心,是让我体感上,觉得 Fed 鹰派的地方。我认为 Fed 承认自己落后给菲利浦曲线 (Behind the curve),简单而言,Fed 这次的加息速度大幅落后给通膨。

由于 Fed 在 2021 年对于通膨的误判,先前 Fed 在 2021 年认为通膨在年底就可望自然回落,但也就是因为这件事没有发生,反而通膨还更为严重,所以目前才有使用加息来追赶通膨的压力。但当前宏观环境看,通膨的压力是来自于缺工、供应链紧俏等问题,再加上拜登政府的大力推行财政刺激在那边推波助澜~

所以这一次的通膨是来自于实体经济上的供需失衡问题,并不是金融市场过度投机、企业超额投资等问题,我认为 Fed 在这次的通膨问题上,能做得空间非常有限。

这裡将产生一个不确定性的较大风险,就是 Fed 只能靠货币紧缩去压通膨预期,但实体经济的根本性通膨问题,还是没有获得解决。变成最终 Fed 只能再用更剧烈的紧缩政策,去引导通膨预期走低后,尝试来压低实际通膨率,所以这裡将让 Fed 的紧缩路径,存在著较大不确定性。

比较好的处理方式,应该是直接去解决实体经济上的缺工和供应链/例如我之前提到的塞港问题,让实际通膨率自己走低、而不是靠 Fed 挤压通膨预期之后去引导。

谁可以去把坐在白宫裡疑似患有阿兹海默的白髮老头一巴掌打醒...还我特~


结论:我个人认为 Fed 今年将加息四次,不至于加息五次,而加息四次之预期,相信市场应该已经定价;至于缩表,相信市场尚未定价,估计将落在 2022 下半年,最快可能是 6 月。

如果 Fed 今年加息五次,我会感到非常意外,因为这意味著 Fed 很可能在 2023 年底、2024 年初,就因为美国经济放缓太快而需要降息,Fed 这波操作就会变得非常韭。

最后说说股市的想法目前 Nasdaq 已经插水一段时日,抑制通胀是当务之急,而股市所谓修正才多久已出现V转。对通胀而言意义不大,修正数月才可能有帮助~所以我之前一直描述为“恐慌”。因此对白髮老头而言,怎麽做才有利于中期选举就很清晰了。

最好还是坚持认为市场或已定价加息四次之预期,但缩表预期则是尚未定价的观点。

配置上美股我倾向持有科技权值股,一些 Megacap 的估值我认为合理、前景确定性较高,而这样也可以让你的收益贴著 QQQ 走。

考虑到一堆成长股腰斩,我也愿意加仓接刀成长股,但建议佔据投资组合的比例,或许不要超过 15%,如果选股功力不错,这裡就会开始让你的收益拉开与 QQQ 之类的差距。

最后,我相信人人都会想在市场下跌的环境裡接刀,接刀不是不行,但若接刀失败,斩缆我建议速度要快,我个人不考虑价投的话一次斩缆的比例都是 50% 以上。




  

相关话题

  AI 自己不会思考,为什么叫做人工智能? 
  如何评价周志华教授新提出的 Deep Forest 模型,它会取代当前火热的深度学习 DNN 吗? 
  有哪些投胎的技巧? 
  目标检测算法中Two-stage算法速度慢,到底在哪里? 
  你的童年,是否也遇到「别人家的孩子」? 
  技校 中专真的去不得吗? 
  机器之心提问:如何评价Facebook Training ImageNet in 1 Hour这篇论文? 
  二十岁的人真的需要来自三十岁的建议吗? 
  机器学习中的机器是如何分辨哪些是有用的知识,哪些是没用的信息呢? 
  如何评价 Kaiming 团队新作 Masked Autoencoders (MAE)? 

前一个讨论
信一神教的民族是怎么看待他们的祖先是不信这个教的事实的?
下一个讨论
女博士是先拼毕业还是先生孩子?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利