86中文网

手机浏览器扫描二维码访问

结构性机甲旋风土豆(第1页)

1.1什么是因果推断

因果推断用于衡量一个行为的价值。即判断一个“因”能导致多少“果”。

比如说我今晚复习数学,明天数学考试能提升多少分。这是一个很难回答的问题,因为我无法同时知道不复习和复习后,我分别能考多少分,当前时刻我只能做一种选择并得到一个结果,另一个选择的结果是永远不可知的,这在因果推断里叫做反事实(conterfactual)。

因果推断往往会衍生出一个研究方向,因果发现。即判断一个行为是否和一个事件互为因果(推断是判断带来了多少果,发现是判断是否为因果)。比如冰棍卖的多和电费高往往同时出现,但他们不是因果关系,因为这种现象主要是天气热带来的。

1.2为什么要研究因果

1.2.1因果性≠相关性[2]

设想一个场景:大数据发现,穿鞋睡觉的人第二天往往会头疼。因此我们可以得出穿鞋睡觉和头疼相关,但这显然是反直觉的,客观规律告诉我们穿鞋睡觉不应该导致头疼。那但数据上为什么会呈现出这个现象呢?

原来是穿鞋睡觉的人大多都喝酒了,所以,真正导致头疼的其实是“隐藏”变量-是否喝酒。(这在因果推断里叫混淆变量,confounder)

深入思考一下,我们为什么会得出”因为穿鞋睡觉所以头疼“的错误结论,那是因为我们隐含的观察到“不穿鞋睡觉不头疼“,两组数据对比下得出结论。但是这个结论错误的关键是,两个集合里喝酒的人分布是不一致的,真实的因果是喝酒所以头疼,因此这里会有数学上的“辛普森悖论”。

因此,这个场景我们只能说穿鞋睡觉和头疼有相关性,但不能说他们互为因果。即相关≠因果

1.2.2因果推断>相关性分析

为了对比因果推断和其他的机器学习问题,学术界提出了三层的因果之梯[3][4]:

相关(Association,观察):解释p(y|x),即已知x的条件下,y会怎么样。这是大部分场景下机器学习所面对的问题,如上一节所述,相关≠因果,故常规的机器学习方法无法处理因果问题。以上面的case为例,假设x=穿鞋睡觉,y=头疼,则该层级会看到两者相关性很高的“假象”。

干预(Intervention,行动):解释p(y|do(x),z),即做某个行为x后,y是怎么样的。比如上面的例子,干预穿鞋睡觉的行为x,单独分析穿鞋睡觉(即do(x)=1)和不穿鞋睡觉(do(x)=0),在不同喝酒状态下的头疼(y)分布。这个层面可以分析出穿鞋睡觉对头疼可能无影响。但无法判断每个人穿鞋睡觉会不会导致头疼,因为观察不到。

反事实(Counterfactual,想象):解释行为x对结果y的影响,即我做了x和不做x,对结果y的影响程度。这是因果推断要解决的问题,比如上面的例子,我不仅看到每个人不穿鞋睡觉头不痛的现象,还能反事实的推断出每个人穿鞋睡觉头不疼,进而得出穿鞋睡觉对头疼的具体影响程度。

上面的解释说明,相关<干预<反事实(即解决反事实问题的方法可以处理干预和相关问题,反之不成立)。传统的机器学习方法是处理相关性问题的,而因果推断关注反事实层。因此因果推断能解释的事情,将比传统的机器学习方法更“高级”,也更贴合日常的需要

2.基础理论

2.1业界流派

因果推断是根据一个结果发生的条件对因果关系得出结论的过程。存在两种研究方法[5]

实验性研究:通过大量随机对照实验(RCT)得出结论。因果推断的难点在于反事实,因此对照实验需要“足够随机”。对上面的例子而言,我们需要在实验组和对照组中确保喝酒的比例是均等的。这是代价昂贵且费时费力的。

观测性研究:对于已有的观测数据,通过建模进行因果关系的研究。这种方式对数学的要求较高且存在准确率的问题,但可操作性强。

显然,实验性研究是理论上最完美的方式,但实际中我们不可能穷举类似“喝酒状态”这种影响因和果的因素,随机对照试验的成本是极大的,仅存在理论的可能。业界的研究重点是,如何优化观测性研究的方法,使其准确度逐步逼近实验性研究。

当前,观测性研究存在两大流派,分别是pearl创立的结构因果图模型(SCM)和Rubin创建的潜在结果模型(RCM)。[6][7]

2.2变量定义与说明

为了便于后续介绍,这里先对因果推断的常用变量做一个说明。黑色粗体为重要定义,TreatmentEffect是衡量干预效果的指标,也是我们期望优化的目标以及模型的输出[5][7][8][9]

2.3因果分析流程

介绍推断的具体方法之前,我们先说明因果分析的流程。如下图,主要有两个步骤[1][10]:

Identification(因果识别):基于观测数据,输出不同干预下的统计分布(即“原因因子”状态不同时结果因子的分布),以分布的gap作为衡量因果关系的依据。SCM模型主要解决这部分问题(并不是说SCM不能做后续的推断)

Estimation(因果推断):根据统计结果,做反事实的推断,以反事实与观测的gap作为效果大小的衡量,这个过程叫Estimation。RCM模型重点在这部分

想减肥想减肥好吃,防护服减减肥进去刺骨寒风

喜欢觉醒失败后我回山里种田请大家收藏:()觉醒失败后我回山里种田

易婚之年,禁欲霸总夜夜癫  HP:月下满河星  穿成带崽女配后我被总裁们疯抢  养仙系统:摆烂后的逆袭之路  南明崛起  烈虎军  惊天大瓜!小弃儿竟是大佬儿子  危险关系:禁欲上司夜痴缠  请叫我倒霉者  综影视:宠妃当道  浴火重生,凤女也恐婚  御兽系统?白毛小萝莉罢了  重生之七零后的修行之旅  院士13岁!八零小村姑轰动全国  被读心后,我成了夫家的团宠  飞升九重  天涯何处不相顾  占有,撕碎,吞噬  开局三个村民:我的帝国时代  被校花所吸引,她问我还不表白?  

热门小说推荐
我真的不想高调啊

我真的不想高调啊

我真的不想高调啊简介emspemsp关于我真的不想高调啊在每一个少年心中,都有一个梦想,为了简单的理由就奋不顾身的去努力,即使偏体鳞伤也在所不惜。我一定要成为世界自由搏击冠军。这是一个少年的青春梦,热血梦。...

漫威的公主终成王

漫威的公主终成王

无论做错什么都会被原谅,因为我实在是太美了!一个魔法公主的全新世界之旅。一个融合了诸多影视作品和游戏的漫威世界。Ps老扑街了,质量有保证。Ps群号639,265,715如果您喜欢漫威的公主终成王,别忘记分享给朋友...

小王爷他必不可能动心

小王爷他必不可能动心

双洁,凭借医术搞事业女主X疯批美人抢江山男主顾珞穿越成了安平伯府养在庄子上长了15年的二小姐。二小姐人美心好就是眼睛瞎,从庄子上来了京都,就被郁王府的小王爷迷得七荤八素。就在顾珞穿越当天,二小姐打算把小王爷生米煮成熟饭一年前。不算宽敞的马车里,顾珞指了郁宴旁边的位置,我坐这里?郁宴靠着车壁,难以置信的道看着顾珞不然呢?你还想坐我腿上?顾珞!可去你大爷的吧!一年后。宽敞的马车里,顾珞指了郁宴旁边的位置,我坐这里!郁宴呜呜呜呜,是我的腿没有马车舒服吗!如果您喜欢小王爷他必不可能动心,别忘记分享给朋友...

落地一把98K

落地一把98K

落地一把98K简介emspemsp关于落地一把98K2018最爽吃鸡文刘子浪,人称浪子刘。当然你们也可以叫他钢琴手,帝国鹰眼,爆破鬼才,战神Vic,绝地狙神。一个在诸神之战FPS世界大赛上陨落的国产天才少年,原本不愿再碰FPS游戏的他却意外地接触到了绝地求生。于是在梦想和现实之间,刘子浪捡起了那把98K。在这个故事里,有热血的比赛,有温馨的日常,有逗比的队友还有一个深陷二次元做直播的妹妹!(书友群284132344,可以...

我家师父超凶哒

我家师父超凶哒

陆尘有五位师父。大师父,一域之主,冠绝古今。二师父,圣地之主,修为盖世。三师父,千古女帝,名传世间。四师父,丹界至尊,誉满天下。五师父,炼器帝师,才情横溢。五个师父倾国倾城,有着沉鱼落雁般的美貌,而如果您喜欢我家师父超凶哒,别忘记分享给朋友...

快穿之我被大魔王独宠了

快穿之我被大魔王独宠了

快穿(全篇架空)1V1小甜文~~各路男神等你撩!平行世界多姿多彩,各种俊俏大佬在线等撩~~①去哪?大魔王顶着惺忪的睡眼,目光却很是犀利。浮萍默默咽了咽口水,手指慢慢向后挪,嘻嘻地笑,帮夫君找东西。大魔王皱起眉毛,扯过浮萍不爽道夫君不就在这里吗,找什么东西!②萍儿过来,这莲花就跟你一样美丽。男人袖下的手轻轻碰了碰女孩的手,立马又缩了回去。浮萍娇羞地低下头。③我给你从王母娘娘那取了写仙露,给你补补灵气。谢谢君上!还有,离那条蠢蛇远些,小心它咬你!知道啦,小醋包!三生三世的三段爱恋,才能建立一段生生世世的长久姻缘。小白文超宠神仙颜值符符尽量写爽文,都怪我太乖,不会写打脸嘤嘤嘤如果您喜欢快穿之我被大魔王独宠了,别忘记分享给朋友...

每日热搜小说推荐