百科问答小站 logo
百科问答小站 font logo



人脑有海量的神经元(参数),那么人脑有没有「过拟合」行为? 第1页

  

user avatar   liu-jiu-si 网友的相关建议: 
      

不会过拟合这个说法是不正确的

不信请看



...








....









----并不奇怪的分割线-----

玩笑开够了可以谈谈正事,过拟合这个讨论范围太大,我们不妨缩小范围,看object recognition会不会过拟合

其实人的object recognition是hierarchical的,基本上就是线条逐渐拼接变成各种简单的多线条,然后这些多线条继续拼接成更复杂的东西,这些东西里有人脸,或者其他东西比如汽车什么的。这些“滤镜”,就是你判断是不是看到了张三还是李四还是法拉利还是菊花或者是耶稣的标准。

Hubel & Wiesel, Receptive fields and functional architecture of monkey striate cortex

ncbi.nlm.nih.gov/pmc/ar youtube.com/watch?

Maximilian Riesenhuber & Tomaso Poggio, Hierarchical models of object recognition in cortex

cbcl.mit.edu/publicatio

这些连接之所以能连接是靠训练得到的,你整天盯着耶稣看到处都是耶稣。整天盯着脸看到处都是脸。这就是过拟合了。


user avatar   yueatsprograms 网友的相关建议: 
      

记得高中的时候有一次考试,穿了件新的蓝衬衣,考好了。

下次考试又穿了那件蓝衬衣,考的更好了,印象中是全班第一(在美国考美国文学那是)。

期末考试的时候,蓝衬衣正好洗了,结果考砸!

这类现象反复发生过好几次,我应该攒了得有十来个数据点。记得有一次考化学故意没有穿,想反正我也不在乎,结果果然考砸了。

从此以后,我开始碰到考试,做presentation,paper ddl等『上了规格』的事情,都穿那件蓝衬衣。现在已经穿出补丁了!

请同学们看到我穿那件蓝衬衣讲poster的时候不要笑:)

----------------------------------------

为了证明自己不是逗比,我来仔细说下这背后的思考。

在很多任务上,人是不容易overfit的,比如视觉。一是因为生物进化这么久,视觉的prior已经很发达了,就像

@Xun Huang

说的。二是因为我们的视觉样本量大,虽然监督弱。人类unsupervised learning的能力的确是很强的。

然而出了这个范围,人还是很容易的overfit的。比如我考试。这是最近一千年才有的一个新鲜事,虽然事关生存,但我们还没能进化出来好的prior。二是样本量的确小,像我顶多也就考过一百次。另外它的机制复杂,复习的好不好,掌握的扎不扎实,前一天晚上睡得好不好,对出题者摸得准不准,有时候都不如粗心算错一个数重要。所以考分怎样的确是一个超高维空间的复杂函数,是用一百个数据点无论如何都不能拟合的。最后它噪音大,比如阅卷老师心情。。。这种distribution,人会ovefit,机器也会。千百年来,凡是符合以上几个条件的,比如天文占卜,国事战争,婚姻嫁娶,升官买房,我们都形成了很多『迷信』,其实就是overfit的模型,有的还一代一代传了下来:)

抽象出来讲,overfitting的理论关心的都是model class和sample size这两个东西。只要人不能比机器选出更合适的model class(with prior knowledge),获取更大的sample size,人在overfitting面前也同样脆弱。


user avatar   enzojz 网友的相关建议: 
      

有啊所有和想象力有关的东西基本都是过拟合,比如那个叫星座的东西,还比如各国的神话。什么玉兔牛郎织女,干旱和发洪水是上天的惩罚,太多了。。。

又比如说空耳也是过拟合


user avatar   fly_qq 网友的相关建议: 
      

我支持。因为匿名是网络环境差的万恶之源。


知乎做得好。与此同时,头条和抖音也上线了IP属地。


根据 @新浪财经 报道:

据悉,今日头条、抖音展示的帐号IP属地均为用户最近一个月内最后一次发文或评论时的网络位置,境内展示到省(直辖市、自治区、特别行政区),境外展示到国家(地区)。而且帐号IP属地以运营商提供信息为准,相关展示不支持手动开启或关闭。

在公告中,今日头条和抖音均提出,展示账号IP属地是为了维护真实有序的讨论氛围,减少冒充热点事件当事人、恶意造谣、蹭流量等不良行为。快手则表示是为了防止部分网友在热点事件中出现蹭流量、传播不实信息、冒充当事人等干扰正常讨论的行为。

实际上,在字节跳动和快手的产品上线该功能之前,微博已经于今年3月先行一步。3月17日,微博官方账号称,因发现个别冒充当地网友发布和传播不实信息的行为,微博将上线“用户个人资料页展示近期发帖所在地”的功能。

据悉,微博也是在个人主页中展示用户最近一个月内最后一次发布微博或评论的IP归属地,而且IP归属地显示规则与评论区此前显示规则保持一致,国内显示到省份/地区,国外显示到国家。


2、

几乎所有的网红产品,都是利用人性的七宗罪所达到的。


而匿名就是网络环境的万恶之源。


匿名,意味着一个人不需要对自己的言行负责,无论你是咒骂那个普通人去死,还是问候他的十八代祖宗。


在网络平台上,我们看过了太多这种悲剧。


为什么女权的“权”会被污名化成“拳头”的拳?


我个人是支持女权的。但是里面有人在故意把水搅浑。


为什么有人被人肉和网暴?


因为在屏幕面前可怕的那个他,不需要承担任何责任。甚至很多明星粉丝对普通人群起而攻之,所倚仗的,不过如此。


为什么微信上的环境要比微博等好得多?


因为微信是实名化的。喷他,意味着他可能能找到你的真实身份,如果他想的话。


当然,做人是需要互联网树洞的。在BBS这种场景下,所有人都可以匿名化。

而在如微博等社交平台上,我支持全面实名化。


但愿天下不再有网络暴力。


user avatar   he-shang-60-78 网友的相关建议: 
      

我支持。因为匿名是网络环境差的万恶之源。


知乎做得好。与此同时,头条和抖音也上线了IP属地。


根据 @新浪财经 报道:

据悉,今日头条、抖音展示的帐号IP属地均为用户最近一个月内最后一次发文或评论时的网络位置,境内展示到省(直辖市、自治区、特别行政区),境外展示到国家(地区)。而且帐号IP属地以运营商提供信息为准,相关展示不支持手动开启或关闭。

在公告中,今日头条和抖音均提出,展示账号IP属地是为了维护真实有序的讨论氛围,减少冒充热点事件当事人、恶意造谣、蹭流量等不良行为。快手则表示是为了防止部分网友在热点事件中出现蹭流量、传播不实信息、冒充当事人等干扰正常讨论的行为。

实际上,在字节跳动和快手的产品上线该功能之前,微博已经于今年3月先行一步。3月17日,微博官方账号称,因发现个别冒充当地网友发布和传播不实信息的行为,微博将上线“用户个人资料页展示近期发帖所在地”的功能。

据悉,微博也是在个人主页中展示用户最近一个月内最后一次发布微博或评论的IP归属地,而且IP归属地显示规则与评论区此前显示规则保持一致,国内显示到省份/地区,国外显示到国家。


2、

几乎所有的网红产品,都是利用人性的七宗罪所达到的。


而匿名就是网络环境的万恶之源。


匿名,意味着一个人不需要对自己的言行负责,无论你是咒骂那个普通人去死,还是问候他的十八代祖宗。


在网络平台上,我们看过了太多这种悲剧。


为什么女权的“权”会被污名化成“拳头”的拳?


我个人是支持女权的。但是里面有人在故意把水搅浑。


为什么有人被人肉和网暴?


因为在屏幕面前可怕的那个他,不需要承担任何责任。甚至很多明星粉丝对普通人群起而攻之,所倚仗的,不过如此。


为什么微信上的环境要比微博等好得多?


因为微信是实名化的。喷他,意味着他可能能找到你的真实身份,如果他想的话。


当然,做人是需要互联网树洞的。在BBS这种场景下,所有人都可以匿名化。

而在如微博等社交平台上,我支持全面实名化。


但愿天下不再有网络暴力。


user avatar   guijishengwu 网友的相关建议: 
      

谢邀。这个问题很简单:如果知道各个号码的中奖概率一样,他们还会成为彩民吗?

***** ***** *****

上面这句话是调侃。如果要认真回答这个问题,得从两个方向回答:

  • (1)“1,2,3,4……” 这样的号码买的人真的少吗?

以双色球(红球 33 选 6,蓝球 16 选 1)为例,在 2015-11-17 的开奖中,全国投注量为 323,653,256 元,即 161,826,628 注,而不同的投注数 共有 17,721,088 种,所以平均每种组合大概有 9 个人投注。那么, 1,2,3,4,5,6,7 这样的组合是否有 9 个人投注呢? 还真的挺有可能呢。全国那么多人玩双色球,有 9 个人次投注了这个充满规律的号还真不奇怪。

所以,题主的命题看起来好像不太成立。

当然了,一定有很多人觉得觉得这个号绝无可能中奖,那么我们来看看近 300 期双色球的开奖情况:

根据计算,四等奖的中奖概率大约为 1 / 2303, 但在最近 300 期里,它中了 1 次四等奖,中奖率还高于平均值呢。

  • (2)为什么有些彩民会觉得 “1,2,3,4……” 这样的号码不容易中奖?

用我自己创造的词语来说:他们被 “归类假象” 蒙蔽了。

什么叫 “归类假象” 呢?

就是看似有意义的归类,在我们所关心的维度下没有意义,反而对我们的判断造成了干扰。

就概率而言,似乎可以用一种很有意义的方式将所有情形进行归类,而看上去不同类别的发生概率差别很大,然而实际上,这个差别只是由于它们在总数上的差异造成的。从任何一个类别中抽取相同个数的例子,其发生的概率或期望并无任何不同。

就本题的来说,我们不难理解彩民们的想法:

他们不自觉地把彩票中奖号码归类成了 “有规律组” 和 “无规律组”。

以双色球为例:“有规律组”的情形可能包括: 7个数呈等差数列,7个数都小于10,7个数都是偶数,7个数包含了两个等比数列等等……其他的都为 “无规律组"。

彩民们研究了一下以往的中奖号码,发现过去好像极少开出”有规律组“ 的情形,所以他们认为:

  • 【买无规律的号码组比买有规律的号码组中奖概率更大】

这个推论有道理吗?看起来好像很像回事呢。

但实际上,上面的那句话是不对的,正确的说法是:

  • 【中奖结果是无规律的号码组比有规律的号码组概率更大】

这两句话有什么不同呢?简单地说,后者是 有规律组 和 无规律组的 等比例抽样,而前者是 有规律组 和 无规律组的 1:1 抽样,样本大小就不一样,概率分布又怎么会一样呢。

举个例子,假设有 100000 个号码组合,其中有规律的有 1000 组,无规律的有 99000 组。

假如彩票中心抽奖了 100 次,每次中奖 1 个号码组合

  • 那平均来讲,只有 1 次是有规律组的, 99 次是无规律组的。无规律组的中奖结果占了 99%。

然而,对彩民来说,

中彩票的平均次数= 买彩票的次数 * 中奖号码属于这个分类的概率 * 买的彩票数在该分类中的比例

如果买了 100 次彩票,每次 1 注,

  • 如果 100 次都是买有规律组,那他的平均中奖次数 E1= 100* (1/100) * (1/1000)=0.001
  • 如果 100 次都是买无规律组,那他的平均中奖次数 E2= 100* (99/100) * (1/99000)=0.001

毫无差异

以上的推导非常简单,连小学生都很容易理解吧?

但是在生活中,这种看似简单的 “归类假象” 可骗了不少人哦。

举个例子,这是一个古老的故事:

曾经有一个女子学院,有一天校长提议道,为了活跃学院的气氛,建议招一部分男生。董事会的成员坚决反对:千万不能这样,否则的话,一年后会有一半的女生退学的!
在最终的妥协下,校长决定,当年招收 1% 的男生做试验。
一年后,校长宣布:“招收男生的计划取得了圆满成功。诚然,学院的女生数量确实有所减少,但一年后她们在该届全体学生中的比例仅仅下降了 1 %”。

你发现问题在哪里了吗?

#


user avatar   YJango 网友的相关建议: 
      

我没记错的话,之前拼多多也有个员工,就是拍照片匿名发脉脉然后被开除,坚持与拼多多打官司的那位。当时轰动一时,得到了很多人的支持,但很遗憾的是后来看他的视频,他已经出国读书了,因为面试其它公司的时候,被质问过这件事。。

毋庸置疑,这位应届生也很勇敢,说出了很多人不敢说的话,年轻人的反抗与斗争是最真挚,但这一切也只有在确定离职的时候——就算不离职也很难呆下去了。

腾讯有这种问题,其它公司大概率也有这种问题,甚至可能更严重,这就是整体环境造成的结构性问题,很难因为一个人一件事而改变。这个应届生不怒怼,腾讯的高管们就不知道吗?就不觉得他们的任务工作分配时间太紧?当然不是。所以我也不相信腾讯说自己要认真反思、尽快整改,就会有什么实质的进步,这也是最悲哀的地方。


user avatar   bsdr 网友的相关建议: 
      

一大早起来真是笑死我了。

由于老头环空前的热潮,以及B站特有的UP主靠制作视频吸引流量转直播的模式,导致很多有人气但完全没有魂系列经验的主播在播这款游戏。比如某幻、瓶子。

(就是一开始制作视频是主业,直播是兼职,甚至是乐趣兴趣,到直播为主,制作视频反倒成了兼职。这种现象在游戏区特别明显。)

这就很有节目效果了,我看几个有名气的主播,都是重复被虐,平均活不过5分钟。真正是在哪里跌倒就从哪里跌倒。

很多在我们这些老玩家看来常识性的东西,对于他们来说完全不存在的。

盾反这种就不提了(其实我也不会),连二人转、回合制、推图都不懂。在大型地牢里不想打小怪,一个劲往前跑,结果变成开火车;当着怪物的面喝药=白喝;开宝箱被怪物背刺;以为学了法术就是法爷了,结果被几只鸟打得抱头鼠窜。

然后另一边,那些原本有魂系列经验的主播,就吃了刻板印象的亏。觉得自己有技术有实力,也不练级就顺着主线硬钢。就比如一上来的野外精英太阳骑士,要么你死要么我亡,绕路是不可能绕路的。

太阳骑士都还好,毕竟王老菊都能杀。

但没有等级,没有血量,没有伤害,硬钢噩兆。

真当噩兆快慢刀是假的,自己打几次就能盾反了?而且老头环这次砍了盾反在BOSS战中的作用,要反三次(二次)才能触发处决。

结果被虐3000遍,又不好意思去练级,尬在那了。

老头环是不是玩家的盛宴我还不知道(买了游戏,昨天也预下载了,结果今天起来发现那个盘满了……正在重新下载,下载完了又发现,我的电脑只有8G内存……),但肯定是不少主播的灾难、观众的盛宴。

当然,我也知道有些主播直播受罪是搞节目效果,但我也是真看到有主播被气到下播了。

另外一点,老头环这次其实是以探索为主要玩法。

B站UP主老戴今天专门做了一期视频讲解,想要玩好、玩轻松,就是尽可能的探索地图,拿物品、刷等级。而不是走到哪杀到哪,打不过硬去打。

就比如第一个剧情BOSS前,大地图上有的是小型地牢,野外精英,要把图清完了再去打噩兆,真跟打弟弟一样。(收回我的话,40级30血20耐20敏+3打刀7瓶奶,打了7次才过。前三次就是纯背板,后三次有点贪,经常血瓶白喝,最后一次基本掌握出手时机,就硬耗过去了。)

其实魂系列游戏特别吃角色强度(等级、装备),一些小怪你一刀砍死和一刀残血,完全就是两种难度。打BOSS,你挨一下就要喝药,和挨两下才需要喝药也是两倍的差距。

不过按照这么个玩法,的确没有什么节目效果。

讲真,还真就是看那些新手主播无能狂怒最有节目效果。

至于游戏本体,如今我也的确是玩上了,总体上来说符合我的期待。

作为一个中年人,我其实是在看了老头环试玩视频后才接触魂系列的。

原因有2,一是手残反映慢,玩这种游戏非常苦手;二是,我其实不太喜欢魂系列那种压抑的黑暗风格。

但老头环作为开放世界,虽然依旧以压抑阴郁为主,但也有光明广阔的场景。比如一开始做完新手指引推门而出的那一刻。

至于在难度与操作方面,远程技能的实用化,召唤物的存在,以及跳砍与伪盾反的出现,真的能够解决很多问题。

只是看你愿不愿意当一个“卑鄙的褪色者”。

远程技能包括法术与射击。我玩的武士,初始给的长弓非常给力。尤其记得推一座城堡图的时候,一开始不清楚套路,进入城堡被满地的炸药桶与两个放火球的法师直接秒了。复活后掏出长弓,一剑封喉,解决掉法师无伤过了。

还有初期的一个地牢,一个场景墙上爬着的与左右墙角蹲着的类似地精的怪物,近战5-6刀才能砍死。

第一次去直接围殴致死。

第二次,用弓箭一只只引过来,很轻松就过了。

至于近战武器,我是非常推荐初期见完老婆就能开箱子拿到的君王大剑。

这把武器虽然攻速低,成长性也低,但在初期真的非常实用。

尤其是在跳劈方面。

这一作跳劈虽然强但也看武器,比如武士上来给的打刀就属于跳劈对空,跳起来横着劈一刀,有时候都打不到站着的怪。而大剑则是竖着往地上砸,范围极大。

我举一个例子,就是我开地图第一次遇到红灵。就是等对方打完一套跳劈就完了。

我的战斗策略就是,遇事不决,举盾防御,然后跳劈。

至于BOSS战,依旧有难度,也许跳劈和法术都没啥作用,依靠的依旧是精准的闪躲后普攻(排除盾反)。

但我觉得这算是魂系列的乐趣之一。

如果随便什么BOSS战都能逃课,那也就没意思了。




  

相关话题

  我们为什么会在不知不觉中忘事?遗忘都是怎样发生的? 
  如何看待QQ邮箱翻译出他人的快递通知? 
  如何评价百度自动驾驶 ApolloAuto 在 Github 上发布的代码? 
  xgboost原理? 
  真的有人实现了辟谷吗? 
  怎么在家学习一些关于机器学习的知识? 
  马斯克用猪展示 Neuralink 脑机接口设备,有哪些亮点和槽点?未来有望应用在人脑吗? 
  机器学习中使用正则化来防止过拟合是什么原理? 
  深度学习中Attention与全连接层的区别何在? 
  把某人的 DNA 序列作为输入,正面照片作为输出,丢到深度神经网络里面学习,可行吗? 

前一个讨论
留学党们家庭经济条件都很好吗?
下一个讨论
最良心的软件可以良心到什么程度?





© 2024-11-21 - tinynew.org. All Rights Reserved.
© 2024-11-21 - tinynew.org. 保留所有权利