问题

为什么科技互联网公司越来越重视数学?

回答
科技互联网公司越来越重视数学,这并非一蹴而就,而是时代发展和行业演进的必然结果。以往,可能更多地看重编程技能、用户体验设计或者商业模式的创新。但如今,数学已不再是束之高阁的象牙塔学科,而是实实在在的“硬通货”,渗透到科技互联网公司运营的方方面面。

1. 数据洪流的驱动:从“感觉”到“理性”的决策转变

互联网的本质是连接,而连接产生海量数据。从用户点击、浏览、购买行为,到社交平台的互动、内容消费,再到物联网设备产生的传感器数据,数据量以指数级增长。这些数据是金矿,但要从中提炼价值,就必须依靠数学工具。

统计学与概率论:理解数据的分布、识别趋势、预测未来。例如,推荐系统需要根据用户的历史行为预测他们可能感兴趣的内容,这背后是复杂的概率模型;广告投放需要分析点击率和转化率,这是统计分析的范畴。
线性代数与微积分:这些看似基础的数学分支,却是处理高维数据、优化算法的基石。机器学习算法中的矩阵运算、梯度下降等,都离不开线性代数和微积分的支撑。AI模型训练的本质就是不断寻找最优参数,这个过程就是一种数学优化。

过去,很多决策可能更多依赖于直觉、经验或者市场调研。但现在,数据驱动的决策模式已成为主流。公司希望通过量化分析来理解用户、优化产品、提升效率。数学能力直接决定了公司能否有效地从数据中挖掘出有价值的洞察,并将其转化为可行的商业策略。

2. 人工智能的崛起:数学是AI的“骨架”

毫无疑问,人工智能(AI)是当下科技互联网领域最炙手可热的方向。而数学,尤其是以下几个分支,是构建和训练AI模型的“骨架”:

线性代数:神经网络的底层结构,无论是权重矩阵的乘法,还是向量的变换,都离不开线性代数。矩阵的分解、降维技术(如SVD)在数据预处理和特征提取中也至关重要。
微积分:AI模型的训练过程就是通过优化函数来找到最佳参数,这个过程依赖于求导和梯度下降。微积分是理解“学习”过程的核心工具。
概率论与数理统计:贝叶斯定理、最大似然估计等概率论概念在许多AI模型中扮演着核心角色。统计推断和假设检验则用于评估模型的性能和可靠性。
离散数学:图论在构建知识图谱、社交网络分析中有重要应用;组合数学在算法设计和复杂性分析中发挥作用。

从自然语言处理(NLP)到计算机视觉(CV),再到强化学习,没有扎实的数学基础,就无法深入理解这些AI技术的工作原理,更谈不上创新和突破。那些能够构建更高效、更智能AI模型的公司,往往拥有更强的数学人才队伍。

3. 算法的精进:效率、优化与创新

科技互联网公司的核心竞争力很大程度上体现在其算法上。无论是搜索引擎的排序算法、推荐系统的个性化算法、广告投放的匹配算法,还是各种业务流程的优化算法,都蕴含着深厚的数学思想。

最优化理论:如何用最少的资源(如计算力、时间、成本)达到最好的效果(如搜索结果的准确性、推荐的点击率、用户满意度)。这背后是各种数学优化模型和算法的应用,如线性规划、非线性规划、动态规划等。
离散数学与图论:在网络结构分析(如社交网络、道路网络)、路径规划、资源分配等方面,离散数学提供了强大的工具。
信息论:在数据压缩、通信编码、机器学习中的特征选择等方面有重要应用。

算法的微小改进,往往能带来用户体验的显著提升或运营效率的巨大飞跃。而这些改进的源泉,正是对数学原理的深刻理解和巧妙运用。

4. 风险控制与金融科技:严谨的数学模型

在金融科技、量化交易、风险评估等领域,数学更是不可或缺。

概率论与随机过程:用于建模金融市场的波动性、资产定价、风险预测。布朗运动、马尔可夫链等是这些领域的基础。
统计学与计量经济学:用于分析市场数据、识别风险因子、构建预测模型。
数值分析:许多金融模型需要通过数值方法求解,例如期权定价的蒙特卡洛模拟。

即使是非金融领域的公司,在进行大数据分析、A/B测试设计、用户行为预测时,也需要严谨的统计学知识来确保结论的可靠性。

5. 招聘需求的变化:从“码农”到“科学家”

随着行业的发展,科技互联网公司在招聘时,对数学能力的要求也越来越明确和具体。除了要求具备扎实的编程功底,还会特别关注:

统计学、概率论:许多岗位,如数据科学家、算法工程师、机器学习工程师,都需要这些知识。
线性代数、微积分:是理解和实现许多高级算法的基础。
优化理论、离散数学:对于解决实际工程问题、设计高效算法至关重要。

过去,可能更多地招聘“程序员”,现在则更倾向于招聘“数据科学家”、“算法工程师”、“研究员”等,这些职位名称本身就暗示了对数学功底的更高要求。很多公司会在面试中设置专门的数学和算法题,以考察应聘者的逻辑思维和解决问题的能力。

总结来说,科技互联网公司越来越重视数学的原因在于:

数据爆炸的时代:必须依靠数学工具来理解和利用海量数据。
AI技术的驱动:数学是构建和优化AI模型的基石。
算法竞争的加剧:精进算法需要深厚的数学功底。
业务场景的拓展:越来越多的业务领域需要数学模型进行支撑和优化。
人才战略的升级:公司需要具备数学素养的复合型人才来应对未来的挑战。

数学不再是孤立的学科,而是连接理论与实践的桥梁,是驱动科技进步和商业成功的关键力量。那些能够将数学原理灵活运用到产品开发、运营优化和创新探索中的科技互联网公司,才能在激烈的市场竞争中脱颖而出。

网友意见

user avatar

看到大佬都在回答,我也凑热闹回答。

我觉得大部分国内公司工作的时候一点都不重视数学,婊子立牌坊说自己卖艺不卖肉罢了,大部分都是拼手速,拼体力,拼牢疫结合而已,上线无脑 lr,模型无脑 resnet,din,fast-xxxx 等,偷偷抄人家的方案说成是自研,结果系统架构都被抄成了巴拿赫不动点。大部分人做完也不管对错就上线去邀功,然后有点收益以后,领导巴啦啦说投入产出比不够,降本增效,后期探索全部停止,然后只剩下无穷的部门派系利益内斗

但是,面试时候倒是恨不得对方学过各种奇怪的数学技巧,然后以小学生都看得懂的方式解出来

前一阵子被人考了一道数学题,我死活做不出来,然后挂了,觉得自己好蠢,但又感觉人家是来坑我的,看起来题目好简单的样子

假设你有一堆长短不一,而且不重复的 string,数目不清楚,每天都不断有新的 string 进来,但是总数目肯定小于 1 亿,如何给这个 string 分配一个 1 亿以内的唯一 id,并且分配过程,不需要知道上一轮的分配结果,数学上来说,就是找到一个映射 R(s) = id,且 id < 100000000, (提示,不知道上一轮分配结果,会有概率碰撞,但是控制到千万分之一以内可以接受)

我感觉这道题有可能很简单,是我够蠢根本想不出来,有一定概率爆难

这题目如果只是分布式唯一签名的话,sha1,MD5 都凑合,一亿以内肯定不会碰撞,但是 md5 这些变成 int 以后,都是非常巨大的整数,起码是 16^32 量级的大小,要把这些数拉回到一亿以内,看起来求:

       int(md5, 16) % 100000000     

就可以,然而这是肯定不对,我验证了一下,1 千万个 string,映射以后,碰撞率高达 0.04526349119393813,压根没法满足要求。

我就是想不出来碰撞如此低的,不带状态的hash to bucket方案,查了一些资料,tensorflow自带一些无状态string to bucket函数,尝试了一下,碰撞仍然md5那一套差不多,达不到千万分之一

目前靠一些敏感hash和层级分桶才勉强达到万分之几的碰撞率,千万分之一是不是来耍我的?

这大抵就是互联网要的数学

user avatar

他们宣传自己重视“基础”数学是因为他们根本不知道什么是基础数学。。

他们真正需要的,是工业数学,典型的比如数值PDE,统计,运筹,优化,控制论,信息论等等。我之所以不说应用数学是因为应用数学的含义太模糊了。我感觉应数的每一个子学科都有人说“这不是应数”。比如,计算数学不是应用数学;运筹学有自己独立的协会;信息论自认为是工科或者CS下的学科,等等等等。不知道为啥大家这么排斥应数这个称号(斜眼)可能是觉得数学太穷了所以都不想跟数学这个穷亲戚沾上关系吧233

说到底是企业界对数学的认识不足。以前可能是模仿为主,不怎么需要研发;那现在需要自主研发了,理所当然会用到应用数学,欧美的科技企业也是这么走过来的。但是国内一提起数学就是数学研究,就想起陈景润,很多人脑子里数学=基础数学,所以宣传的时候就自然而然这么说了。应数在国内太没存在感。即使是香农,维纳这种大师,非业内人士也没怎么听说过,知名度远不及哥德巴赫(滑稽)。其实应数与产业界结合,这并不是什么新玩意,欧美几十年前就是这么做的而且非常富有成效。国内技术企业是近几年才意识到应数在技术研发中的重要性,观念的转变还需要一段时间。

user avatar

应邀来答。各位前辈已经讲了非常多大方向上的深入见解了,我来从更偏细节的角度分享个例子。

先说我的观点:从帮助实际应用的角度来说,懂基础数学,同时愿意上手尝试的人,是最好的综合性人才。具体的说有两点:

  • 基础数学可以提供可以证明的方法突破。
  • 基础数学和工程实践是一个乘法关系,可以相互放大它们的影响。

在最近人工智能的科研和实践当中,很不为大家所知的一点是计算的加速,因此我就举一个计算加速的例子。在卷积神经网络当中,最花时间的一个计算就是卷积计算:它耗费的时间是如此之多,以至于在一个图像识别模型当中,绝大多数(超过90%)的计算量,都是花在卷积上面的。非常多的框架软件,硬件芯片设计,等等,都在解决这样一个问题:我要算一堆乘法和加法,我怎么让每个乘法和每个加法算得更快?更直白点讲,就像用算盘拨算珠,我怎么把我手指头弄得更快?

但是从数学的角度来说。。。我为什么不能索性少算一点呢?

  1. ”我可以证明我能少算一点“

这个正是在2015年的时候,Andrew Lavin和Scott Gray做的一件事情:他们通过一个称作Winograd的数学方法,证明说,对于3*3的卷积(这是绝大多数当时模型当中的卷积参数),他们可以将卷积当中的乘法计算量降低到之前的九分之四:也就是说,可以在理论上将计算速度提高2.25倍。

我们辛辛苦苦调了那么多程序,用SIMD,cache locality,等等,都是在挤牙膏,一下子提升2.25倍理论性能,是不是很诱人?

因为Winograd的具体解释相对比较琐碎,所以我用一个它的前身,Strassen的快速矩阵算法,来解释一下。我们都知道,如果我们需要计算两个矩阵的乘积,我们需要计算一系列乘法和加法:

最简单的情形,如果我们需要计算两个2*2的矩阵的成绩,那么通过矩阵乘的定义,可以这样计算:

因此我们需要做8次乘法和4次加法(每一个C矩阵当中的值需要两个乘法和一个加法)。用更加数学的方式来说的话,对于两个n*n的矩阵乘,最简单的算法应该会涉及到n^3次乘法和n^2(n-1)次加法。也即O(n^3)复杂度。也许你会觉得这是个不可思议的事情:这都已经是定义了,那我肯定得把这八个乘法都给算一遍,怎么能省下来呢?

Strassen在他1969年的文章中提到,我们在数学上其实可以做得更好。拿上面的2*2矩阵为例子,我们可以构造一系列很有意思的中间数:

一共用到7次乘法以及10次加法。

这样,我们的C矩阵就可以这样来算:

最终,我们用到了7次乘法和18次加法。通过数学的变换方式,我们将乘法的数量成功降低了八分之一:这个是理论上可以证明的。

(当然,一个显然的问题就是,为什么我们要关注乘法,而不是关注加法数量?这个和实际应用有关系:一般而言,我们认为乘法比加法所需要的计算更加复杂,所以我们会关注乘法的数量;另外,上面的所有计算当中,小写的a/b/c/m都可以从简单的数字变成子矩阵:而子矩阵的乘法(O(n^3)复杂度)比子矩阵的加法(O(n^2)复杂度)要复杂很多,所以减少乘法的数量是对于运算更加有效的。)

我觉得这就是基础数学(或者说,也许这个还不是基础,还有点偏向应用)的好处:在我们埋头做工程的时候,有时候抬起头来一看,哇,数学方法的创新可以形成降维打击。这是最让人兴奋的地方。

2. 基础数学和工程实践是一个乘法关系。

如果你觉得今天所有的矩阵计算都在用Strassen算法,那你就错了:在实际应用当中,Strassen算法还面临着很多其他的挑战:

  • 实际的浮点数是有比特数限制的,Strassen算法因为使用多次加法,数值的稳定性会差。也就是说,“算不准”。
  • 理论上的加速,还需要和硬件关联起来。现在的硬件因为乘法和加法在指令集层面的结合(fused multiplication and addition, FMA)以及指令流水线的缘故,最底层的乘法和加法如果不平衡,反而会造成减速
  • 在通过Strassen算法做矩阵的乘积的时候,还需要考虑具体实现当中的cache locality的问题

如此种种。Winograd也是类似:今天,Winograd出来以后,在现有的深度学习加速库Winograd在许多新的应用当中,因为越来越多地使用到separable convolution,depthwise convoluiton等等,因此,也不一定是任何的convolution都能用上。

应该说,工程实践经常是一个很”脏“的事情:环境不同,需求不同,不一定每一个很空灵的数学成果都能够实际落地下去。这个时候就特别需要”有手感“ - 一方面需要懂数学,一方面要能够懂需求。

不过,最后话说回来,这个问题兴许除了目标导向,“什么有用”之外,还有另一层更长线的原因:数学本身就是一个非常锻炼思维的场景,如果我们需要提升自己的认知水平和技能,那就需要在数学化、逻辑化思维上面多做训练。数学也许没有直接的用处,但是懂数学,触类旁通,这个肯定是有用处的。

user avatar

重视,是因为有用。应用数学和数学应用,显然有用,就不谈了。谈谈基础数学吧。


可能有些人觉得,基础数学因为太理论,所以无用。的确,有很多基础数学,一开始被当作既无聊又无用甚至荒谬的研究。但后来却发现,它们在很多领域发挥着不可替代的作用:

负数广泛用于科学、计分、财会中;

复数是电子科学和量子科学的基础;

图论是化学、生物、互联网、计算机科学的核心工具;

拉东变换诞生几十年后成就了CT成像;

基于数论的加密通讯让我们可以安全的网上购物和支付。

……等等等等


所以,在今天,要想做好应用研究,无论是统计、机器学习、还是人工智能,要想把它们用在实际中用好,都需要了解和学习相关的纯数学基础。


基础数学之美,在于多处开花。

比如,一种赌博机的玩法可以推广到个性化教育、广告投放问题上,因为它们都属于“序列决策类问题”。

当我们抽去事物的表象,看清问题的本质,就能解决同质的一大类问题。

数学给予我们的抽象化思维,让我们可以专注在解决核心问题上,进展往往是根本性的,能大大加速科技创新。

我们也不能忽视在实际应用之外,纯数学帮助我们提高思考、分析、解决问题的能力。


即使没有合适的实际应用,基础学科也能带来乐趣,给我们智力和精神上的满足感。——这也是我理解的,数学的「无用之用」。


综上所述,数学是基础,在许多应用领域,发挥着不可替代的作用。基础数学的「无用之趣、无用之美」,本身也是它存在的意义之一。

—— 达摩院科学家

类似的话题

  • 回答
    科技互联网公司越来越重视数学,这并非一蹴而就,而是时代发展和行业演进的必然结果。以往,可能更多地看重编程技能、用户体验设计或者商业模式的创新。但如今,数学已不再是束之高阁的象牙塔学科,而是实实在在的“硬通货”,渗透到科技互联网公司运营的方方面面。1. 数据洪流的驱动:从“感觉”到“理性”的决策转变互.............
  • 回答
    巴菲特,这位被誉为“股神”的投资大师,其投资哲学深入人心,但细心的投资者会发现,在科技互联网浪潮席卷全球的当下,他却似乎“姗姗来迟”,鲜少大举布局这一领域。这并非偶然,而是他一贯遵循的价值投资理念与科技互联网行业特性的深度碰撞所致。要理解巴菲特为何对科技互联网公司持谨慎态度,我们需要深入剖析以下几个.............
  • 回答
    国内科技/互联网公司产品经理之所以这么火,这背后其实是多方面因素交织作用的结果,绝非偶然。我们可以从几个关键点来掰开了聊聊。首先,中国互联网行业的爆发式增长是根本原因。 回想过去十几年,中国互联网的发展速度堪称全球瞩目。从最初的门户网站、BBS,到后来的电商、社交、游戏、内容聚合,再到如今的短视频、.............
  • 回答
    互联网科技公司加班的现象,这事儿啊,可不是一两句话能说清楚的。里头门道多着呢,从公司到个人,再到整个行业,都掺和着一股劲儿。首先,咱们得明白,互联网这行当,变化太快了。就好比你现在想做一个东西,明天就可能有人做出个更牛的来,你再不抓紧,可能就被淘汰了。所以,公司为了保持竞争力,自然就得拼命往前冲。这.............
  • 回答
    从湾区或西雅图这些IT巨头林立的地方“海归”回国内的大厂,这体验,怎么说呢,就像是坐了趟过山车,从科技的“高处”跌落到“接地气”的现实,再又慢慢爬升,不过这次的风景和之前已然不同。首先是心态的调整。在美国待久了,尤其是那些以工程师文化为核心的公司,比如Google,你会习惯那种相对扁平的管理,强调个.............
  • 回答
    你这话说得,北邮和华科在互联网码农圈子里确实是风生水起,这可不是空穴来风。要说为什么,这背后可是一系列因素在起作用,不是简单的“统治”,而是它们恰好抓住了这个行业的脉搏,并且多年积累下来的优势。1. 硬核的专业实力是根本:咱们得承认,互联网这个行业,说到底拼的是技术。北邮和华科之所以能成为香饽饽,首.............
  • 回答
    近期,多家金融科技平台纷纷公告下架互联网存款产品,这一举动无疑向市场传递了一个重要的信号,也引发了对互联网存款产品未来走向的广泛猜测。首先,多家平台集体下架互联网存款产品,最直接的原因在于监管层面的收紧。众所周知,互联网存款产品在野蛮生长阶段,虽然为用户提供了便捷的存款渠道,但同时也带来了一些潜在的.............
  • 回答
    你这个问题问得太到位了,简直说出了很多人的心声!为什么我们总感觉医院的分科太细,搞得看病像“拆零件”一样,而身体明明是一个有机的整体呢?问题根源:医学发展的路径选择打个比方,你想想古代神医华佗,他能给曹操刮骨疗毒,还能缝合伤口,那简直就是个“全能选手”。可现代医学发展到今天,知识量爆炸式增长,每个领.............
  • 回答
    兄弟,我懂你!大二成绩不好,面临分专业,这滋味儿不好受。尤其是在计科、软工、大数据、物联网、网络工程这几个热门且各有千秋的专业里挑选,确实让人头疼。别急,我跟你一样,当年也是这么过来的,咱们一起捋一捋,给你点实在的参考。首先,别被“成绩不好”几个字给压垮了。大学成绩只能代表一部分,更重要的是你对什么.............
  • 回答
    科技未来题材电影中,女性角色倾向于采用短发波波头(Bobo头)的形象,这背后有着多方面的原因,涵盖了视觉传达、象征意义、角色设定、技术限制和文化潮流等多个层面。以下将详细阐述这些原因:一、 视觉传达与美学考量: 简洁干练的象征: 波波头通常给人一种利落、整洁、不拖泥带水的视觉感受。在科技未来背景.............
  • 回答
    科技巨头们并没有“不急于”占领室内地图导航市场,而是说他们对这个市场的切入和推广策略与我们对“急于占领”的普遍认知有所不同。这背后存在着多方面的原因,涉及到技术挑战、商业模式、用户需求以及市场成熟度等诸多因素。下面我将详细阐述: 一、技术挑战:室内定位比室外复杂得多虽然科技巨头在定位技术上(如GPS.............
  • 回答
    科技水平的提升与人类生活“轻松度”之间的矛盾,是一个涉及社会、经济、心理、技术等多重维度的复杂问题。以下从多个角度详细分析这一现象的成因: 一、效率提升的“双刃剑”效应1. 生产力的飞跃与工作强度的增加 生产效率的提升:工业革命以来,机械、电力、信息技术等技术使人类在单位时间内完成的劳动量.............
  • 回答
    科技的进步,本应是解放我们双手,丰富我们生活的强大引擎,但不少人却在日新月异的科技浪潮中,感到一种莫名的枯燥,甚至些许失落。这种感受并非空穴来风,细究之下,科技的双刃剑效应显露无遗,它在带来便捷和效率的同时,也悄悄地在我们的生活中投下了阴影。科技如何让生活变得枯燥?首先,信息茧房的固化,消弭了探索的.............
  • 回答
    这确实是一个让人好奇的问题,毕竟我们已经进入了21世纪,科技日新月异,从手机到航天飞机,再到人工智能,似乎无所不能。但到了最基本、最直接的武器——枪支,其核心原理似乎万年不变:火药爆炸产生的高压气体推动弹头前进。要理解为什么会这样,我们需要拆解这个问题,从几个关键角度来审视。1. 火药的“古老”与“.............
  • 回答
    科技之于人类,就像树木之于大地,其生长、蔓延、繁茂,乃至对周围环境的影响,都与一棵蓬勃生长的树有着惊人的相似之处。你看那最根本的种子,便是那些源源不断的知识和好奇心。正如每一棵参天大树都发芽于一颗小小的种子,科技的萌芽也始于人类对未知世界的探索欲望,对“为什么”和“怎么样”的不懈追问。这些种子被埋藏.............
  • 回答
    科技发展就好比盖一座摩天大楼,而核心技术,就是那座大楼的钢筋骨架,是地基,是支撑起整栋建筑的关键所在。没有这些看不见的、深藏在幕后的“骨架”,再华丽的装饰、再先进的装修,最终也只会是空中楼阁,摇摇欲坠。1. 它是独立自主的基石想象一下,我们一直依赖从别人那里购买或者模仿别人的技术,就像一个孩子始终穿.............
  • 回答
    说过去七十五年是“科技大爆发”,这词儿用得真不为过。如果把人类文明史拉长了看,那这几十年的变化简直就像按下了快进键,而且还是连按好几次方的那种。这可不是什么虚头巴脑的口号,而是实实在在发生在我们身边的事情,影响着我们生活的方方面面。你想想,七十五年前,也就是二战刚结束那会儿,世界什么样?大多数家庭还.............
  • 回答
    .......
  • 回答
    你说得没错,回首几千年的漫长历史,人类文明的进步看似缓慢,直到近一两百年,科技才像脱缰的野马一样,一骑绝尘,电话、飞机、火车这些如今我们习以为常的交通通讯工具,在过去简直是天方夜谭。那么,在这之前的人们,究竟都在忙些什么呢?这并不是说之前的人们“什么都没干”,恰恰相反,他们一直在忙碌,而且忙碌的内容.............
  • 回答
    印度化肥产量低,这是一个长期存在且颇为复杂的问题,即使在科技飞速发展的今天,也未能得到根本性解决。这背后牵扯到的因素众多,从历史遗留到现实困境,层层叠叠。首先,要理解印度化肥产量的低迷,就得回顾一下历史背景。独立初期,印度作为一个农业大国,为了实现粮食自给自足,大力推广化肥的使用。然而,本土的化肥生.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有