手机浏览器扫描二维码访问
2.4结构因果模型(SCM)
2.4.1基本定义[5][11]
这是一种基于因果图(casualgraph),构建各类因子间因果关系的方法。该方法可以将因果图转为结构化等式(structuralequations),并通过do算子干预因果图,打破混淆因子干扰,完成因果发现。
那什么是因果图呢,这是一个有向无环图(DAG),节点表示因子,有向边表示因果关系和大小。如下图(a)是SCM的一个示例。其中t为treatment(即要分析的“因”),y是目标,x是混淆因子。显然,x的存在干扰了分析t对y的影响,作者提出通过do算子去除混淆因子x对treatment的影响,这也是SCM做因果分析的关键。
那具体是怎么实现的呢?我们需要先了解因果图里的经典结构
2.4.2网络结构与前后门准则[11][12]
三种经典的图结构
当我们分析X和Y的因果关系时,如果存在其他变量Z,则它们的关系不外乎以下三种图结构。
链式(a):X->Z->Y。有且
叉式(b):X<-Z->Y。同链式有且
V式(c):X->Z<-Y。有且
那么针对这三种图结构,如何输出X变化对Y的影响呢?我们的重点是如何“过滤”变量Z对分析的干扰(这也是因果识别的目标)
2.后门准则:该准则对应叉式的图结构
后门标准(后门准则):如果变量集Z满足:①不包含X的子孙节点;②阻断了X到Y的所有后门路径。则称Z满足(X,Y)的后门准则
后门调整:基于后门路径,通过干预do算子消除混淆因子的影响,仅使用已知的数据分布,估计变量之间的因果效应
3.前门准则:该准则对应链式结构
前门标准(前门准则):如果变量集Z满足:①阻断了X到Y的所有路径;②X到Z之间没有未阻断的路径(X到Z不存在后门路径);③Z到Y之间的所有后门路径都被X阻断。则称Z满足(X,Y)的前门准则
前门调整:和后门调整类似,通过do算子去除前门路径(链式)的影响
2.4.3示例说明[13]
这两个准则应该如何使用呢?这里提供一个case
背景:有一种药物,对于男士群体而言,使用该药物后发病率降低。对于女士群体而言,使用该药物后发病率也会降低。但是,对男女人群一起统计,则结论相反
假设T=1表示服药,T=0表示未服药,Y=1表示发病的概率,Y=0表示未发病的概率。显然P(Y=1∣T=1)=0.78<P(Y=1∣T=0)=0.83,这是因为没有考虑混淆变量“性别”的影响,出现了辛普森悖论。
如下图,通过后门调整,去除掉性别对服药的干扰。则最终P(Y=1∣do(X=1))=0.832>P(Y=1∣do(X=0))=0.781,说明服用此药物确实可以降低发病率。
后面调整的计算逻辑如下:
2.4.4因果识别
当前SCM模型更多用于因果识别,这是因果推断伴生的研究课题。其目标是从一系列的因子里,找出各因子间的因果相关性并输出因果图,则后续可根据casualgraph分析两两因子间的相互影响,揭示因子对结果的多层传递性影响。举个例子[14],我们研究影响产品销量的因素时,可能存在产品价格、产品属性、门店信息、市场竞争情况等因子需要考虑。我们可以构建多个类似下图的因果图模型,然后通过do算法实现干预,判断各因子间存在的因果关系,最终输出概率最大的因果图作为识别的结果[15][16]。本文主要关注因果推断,因果识别不做展开讨论,更多示例可参考相关文章[17]
2.5潜在结果模型(RCM)[11]
RCM关注的是干预前后的期望变化,即2.2所述的Treatmenteffect。该模型不考虑分析所有因子的因果性,只关注treatment和output之间的因果强弱,因此也不需要构建完整了因果图,而是假设treatment和output外的其他因子均为混淆因子,构建粗略的因果图,通过预测反事实的结果,并于观测对比来完成因果推断。
该模型的期望输出分为四种(ATEATTCATEITE),可根据业务需求选择。对于for单个研究对象的反事实推断,模型的目标是计算每一个样本i的因果效应,即=(T=1)?(T=0)。以3.3服药和康复的case为例,T=是否服药,Y=是否康复。我们知道,一个人是无法同时观测到吃药和不吃药对康复的影响,SCM也无法推测服药对某个用户的价值。而RCM则会根据数据形态(即用户属性、历史表现以及混淆因子“年龄”等)预测实际未发生的行为将产生的结果,从而推断出ITE。同理可得出ATE、ATT、CATE。
因为业界很多时候关注的是单个treatment因子的价值,所以RCM往往是业界的首选。
2.5.1基本假设
RCM存在如下3个基本假设[18]:
稳定单元干预值假设(StableUnitTreatmentValueAssumption,SUTVA):任意单元的潜在结果都不会因为其他单元的干预发生改变而改变,且对于每个单元,其所接受的每种干预不存在不同的形式或版本,也不会导致不同的潜在结果。以吃药康复的例子解释这里的两层含义,其一是你吃不吃药不影响我是否康复;其二是每种干预是唯一的,吃药不存在吃很多、吃很少的情况,统一药量,要考虑药量就要设置不同的干预值(即此时干预变量不能只是0和1)
喜欢觉醒失败后我回山里种田请大家收藏:()觉醒失败后我回山里种田
院士13岁!八零小村姑轰动全国 危险关系:禁欲上司夜痴缠 御兽系统?白毛小萝莉罢了 综影视:宠妃当道 被校花所吸引,她问我还不表白? 南明崛起 养仙系统:摆烂后的逆袭之路 易婚之年,禁欲霸总夜夜癫 占有,撕碎,吞噬 重生之七零后的修行之旅 请叫我倒霉者 穿成带崽女配后我被总裁们疯抢 天涯何处不相顾 被读心后,我成了夫家的团宠 飞升九重 惊天大瓜!小弃儿竟是大佬儿子 烈虎军 开局三个村民:我的帝国时代 HP:月下满河星 浴火重生,凤女也恐婚
周昭暖在冷宫出生,四岁的时候,娘亲告诉她,如果她不去抱她爹的大腿,她们一家人都得死,于是,小团子凭着一腔孤勇爬上了金銮殿,看着那个杀人不眨眼的暴君初生牛犊不怕虎般抱住他大腿直喊,我不是野种,我是你的种。某暴君笑话,他十年不举,哪里有什么孩子,一脚将人给踹了出去。得知真相后,他屁颠屁颠的追女火葬场...
白羽穿越了,他本以为这是一个普通的末世王朝,直到他看到有人召唤出了名为灵的存在。在这个奉行万物皆有灵的世界,越珍贵的宝物灵越强,那么白羽摸出裤兜里的手机陷入了沉思。白羽这次穿越我其实是拒绝的。如果您喜欢这次穿越我是拒绝的,别忘记分享给朋友...
1号小鲜妻慕少,来亲亲!简介emspemsp关于1号小鲜妻慕少,来亲亲!不吃与吃回头草?世人都说菩提树下有佛知,医道有言莫背之。重活一世,安谨言以为自己会像重生小说女主一样拥有金手指,脚踩白莲花,手撕渣男鸡,却不想都他么的是坑,跳...
隐婚甜妻恶魔老公不好惹简介emspemsp关于隐婚甜妻恶魔老公不好惹少爷,不好了!少奶奶冒充您的身份,打了导演!少爷,不好了!少奶奶冒充您的身份,揍了制片!少爷,不好了某男冷哼,我的女人,想打谁就打谁,用的着大惊小怪?可是少爷,少奶奶她冒充您的身份,包养小鲜肉,潜了小鲜花,还说要将您的影视公司变成她的后宫团!某男大怒,反了她了!把她给我抓回来不,我亲自去!当某男带着人气势汹汹的找到左拥右抱的某女时,某女眨眨眼,亲爱的,你看这些黑锅...
我跟你讲,二次元是真的棒!夏至清点着自己的收藏和战利品,嘴巴都要乐歪了。不用担心炼制法器时总有讨厌的正道修士跑来打扰,也不用担心什么时候业力缠身心魔入体。就算有些世界人不能杀,妖不好动,那我拿其他种族开刀总没关系吧?哥布林白骨幡,卡巴内白骨剑,血肉傀儡,秽心乱神血杀阵,百鬼夜行图二次元真是个大宝藏!我最爱二次元了!如果您喜欢二次元里的魔道修士,别忘记分享给朋友...
强势宠婚腹黑总裁套路深简介emspemsp上辈子孟辞眼瞎心软,被养女和渣男害死,一朝重生孟辞擦亮眼睛,抱着老公金大腿,手撕白莲花,狠虐渣男,走上了人生巅峰。老公,总有人想让我和你离婚。孟辞抱着老公金大腿,疯狂撒娇,白莲花气得咬牙。霍庭...