现在因果推断确实是一个挺热门的方向,但至少在玩的感觉中,这更多的是对于统计、计量、生统/流行病学之类的领域而言。它是不是或将来会不会是ai领域的热门方向就不好说了。
说实话,我也不太了解cs的人做了啥因果推断的东西..但就我个人的感觉吧 ,狭义上说,causal inference也是inference呀,cs的人真的会在意inference吗?另外对于因果推断而言,没有严格理论证明的文章我总感觉多少有点..歪门邪道?毕竟因果推断往往没法用实际数据集验证方法好坏,就跑跑simulation又显得说服力不够。而理论证明更多的还是统计、计量之类的人做的事。
但反过来,因果推断现在确实很受机器学习方法好坏的影响。特别是在17-18年左右提出了sample splitting和double robust machine learning的方法之后,因果推断中往往可以嵌套任意的机器学习方法。更有效的机器学习方法自然会使得基于此的因果推断更加准确。另外,也有基于某种机器学习算法的因果推断方法,比如基于rabdom forests的causal forests。所以,因果推断实际上是受益于机器学习的方法和理论的发展的。
除此以外,也有ai领域中和因果推断相当有交集的方向。特别是强化学习和因果推断中的optimal dynamic treatment regimes就非常相关。在这俩方向上,将来或许会有更多的两个community之间的相互借鉴吧。
NB:我本专业不是做这个的,我也不是这个科班出身的人,我只是从一个外行的角度来判断这个问题,真正判断还要交给这个领域内的专家学者们去讨论
说实话,因果推断这个领域给我的感觉一直都很奇怪。仿佛是统计学和情报学的融合怪。(我列举这两个学科是有原因的,后面谈)
当然,该夸的还是要夸,因果推断大大拓展了统计学(计量经济学)的工具箱,同时也能recall这些机器学习研究者对domain knowledge的重视,生成的知识图谱与关联图景,在下一个十到二十年当中有着极大的需求缺口。但是,下面开始吐槽槽点:
一方面,统计学确实有一些工具来衡量变量之间的相关特性,比如我们常用的Granger-causality,包括shannon的信息熵(我之前在金融领域接触过用信息熵做度量的),都可以作为考察[包含时序特性的]相关性。
相关性够用么?说实话不太够用,相关性不等于因果性这个槽点已经被统计学里面的人反反复复吐槽过多少次了,但是为什么还要用相关性?有些时候你真的没法解释背后的因果逻辑是什么,尤其是高维数据信息下的复杂系统内部因果关系,你知道A是B的因变量,协变量,控制变量还是门限变量吗,这个真不好说。在一些领域他们还在用OLS看R square,你还想做个多么复杂的模型?复杂度差不多得了。
另一方面,因果推断的实务应用,是我目前所见过的机器学习各个领域当中最为依赖domain knowledge的,没有之一。(我很喜欢这个特性,别想搞机器学习帝国主义!搞了你也没法落地!)
在我的眼中,其实这是情报学在信息技术时代的复古维新。机器学习在信息时代所做的事情,跟那些情报机构(特指办公室文员)所做的其实是差不多的,在海量的数据当中找出不同变量的联系,针对群众进行筛选识别画像,将同一个个体或者实体店行为匹配起来,从而挖掘出其背后的行为规律、目的与意图。
而且既然谈到了情报学,从情报学的角度来讲,我们就很自然地有几个问题来拷问当前的因果推断:
这不单单是因果推断一个领域学者所能完成的工作,甚至是cyberspace administration的工作(主席令第九十一号)。
在未来的十年到二十年内,因果推断毫无疑问有着庞大的业务需求,以及军民融合的战略级前景。但是...因果推断的瓶颈不在本领域内,而短期内也看不到一个社群足以团结这些人来共同解决这个工程问题发展过程当中的问题。或许会有一场热潮,但是盛宴终将结束,而或许有一批传火者,在大低谷当中解决这些问题,而等到那时,或许“因果推断”也会以另一种名字被人传扬。
to be or not to be?
中途岛战役……
雌性动物眼中, 雄性动物漂亮/有吸引力.
雄性动物眼中, 雌性动物漂亮/有吸引力.
男性眼中, 女性漂亮/有吸引力.
女性眼中, 男性漂亮/有吸引力.
默猜题主是男人, 或雌性动物.
雄性孔雀, 颜色丰富; 那么女性是否比男性颜色更多?
雌性猴子的红屁股, 算好看算不好看?