数据分析思维-因果思维数字化奥迪派克峰2.7亿世界上就一辆
黄瓜腌制方法和配方因果思维三重天
因果关系(定义)是一个事件变量(即“因”)和第二个事件变量(即“果”)之间的作用关系,其中后一事件被认为是前一事件的结果。撬动或改变因,可以得到想要的果。反复改变因,都能得到同样的果。
1 关联关系(因果思维一重天)
现实生活中大部分我们认为的因果关系其实只能算作关联关系。关联关系是因果思维的最初级阶段,因为它仅仅是一种基础的观察能力,发现环境中规律的能力,这种能力为许多动物和早期人类所共有。这种规律有可能对,也有可能错,当然大部分情况下还是对的(存在即合理)。
腾讯会员免费账号密码2022>报考研究生的条件关联(定义): 事件A和事件B在空间或时间上一起出现,不考虑时空的先后关系。
举例子:
关联(动物):农民只要在院子里面叫唤几句,鸡鸭鹅都过来吃的。
关联(人):人类观察到公鸡打鸣和天亮一起出现,于是,很多人就闻鸡起舞。
键词:观察 or 统计分析
例如:一家百货公司的销售经理可能会问:购买啤酒的顾客同时购买尿布湿的可能性有多大?此类问题正是统计学的安身立命之本,统计学家主要通过收集和分析数据给出答案。在这个例子中,问题可以这样解答:首先采集所有顾客购物行为的数据,然后筛选出购买啤酒的顾客,计算他们当中购买尿布湿的人数比例,这个比例称为 条件概率,用于测算 买啤酒和买尿布湿两种行为之间的关联程度。
形容老师统计学家为了确定变量之间的关联,开发了很多复杂的方法,例如:相关分析或回归分析,其具体操作是将一条直线拟合到数据点集中,然后确定这条直线的斜率。不管最后p值如何,结果都不能告诉我们啤酒或尿布湿哪个是果哪个是因, 就像人们不明白公鸡打鸣叫起了太阳,还是太阳让公鸡打了鸣。
对已经发生的事情(历史数据)进行观察(统计分析),发现规律,得出初步结论
按照这种定义不难推断,深度学习等等也属于关联分析的范畴,不管神经网有多深,算法有多复杂,因为本质上说他们都是对历史数据进行统计分析。
2 行动干预(因果思维二重天)
如果说你对公鸡打鸣 导致了天亮这个因果关系有所怀疑,你会怎么做?
一般你会这么想,把自己家里的公鸡杀了,如果他们是因果关系,那么第二天天就不会亮。
把公鸡杀了,在这里就是 行动干预。行动干预的典型特征是,主动改变你怀疑的这个因,然后观察他产生的主动数据。他跟一重天观察的关联关系的最大区别就在这里,前者是观察历史被动的数据,后者是人为干预之后的主动产生的数据。两种数据的差别如下:
被动数据(观察分析):拥有很多不可控的潜在的隐藏变量
主动数据(主动干预):可以充分设计干预行动,达到控制消除隐藏变量的效果
案例1 :小孩子的天性就爱探索,其实他们就是在探索因果关系,
例如:你会发现小孩很会讨好大人,因为他们在试探哪种行为会让大人开心,大人开心了,就会给他买礼物或者带来愉悦的生活环境。如下图:当小孩看到奶奶生气了,他就在想是不是自己不听话导致了奶奶生气,于是小孩就改变自己的行为举动来让大人开心。
案例2:我们把啤酒的价格翻倍,尿布湿的销售额将会怎么样? 如果按照关联性思维,应该是直接进入存在历史购买信息的数据库,看看啤酒价格翻倍的情况下,尿布湿的销售额的变化。
这样的结果显然是有缺陷的?原因在于,在以往的情况中,涨价可能处于完全不同的原因。例如:产品供不应求,新冠疫情的影响,其他商店也不得涨价等。但现在,我们并不关注行情如何,只想通过刻意干预啤酒设定的新价格,因而其带来的结果就可能与此前顾客在别处买不到便宜啤酒的购买行为
大相径庭。
虾菇对未发生的事情进行主动的行为干预(设计实验),产生新的数据(主动数据),得出初步结论
预测干预结果的一种非常直接的方法是在严格控制的条件下进行实验。像脸书这样的大数据公司深知实验的力量,他们在实践中不断地进行各种实验,比如考察页面上的商品排序不同或者给用户设置不同得到付款期待会导致用户行为发生怎样的改变
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论