学习笔记55数据分析常见⾯试题4-16
业务与⽤户分析-4
16.你了解的回归分析有哪些(阿⾥)
你了解的回归分析有哪些(阿⾥)
16.
参考答案
将回归分析中的Y(因变量)进⾏数据类型区分,如果是定量且1个(⽐如⾝⾼),通常我们会使⽤线性回归,如果Y为定类且1个(⽐如是否愿意购买苹果⼿机),此时叫logistic回归,如果Y为定量且多个,此时应该使⽤PLS回归(即偏最⼩⼆乘回归)。
淘宝某⽇销售额下降,分析原因(阿⾥)
17.
17.淘宝某⽇
参考答案
销量=下单数 *(1-订单取消率-退货率),
这个公式就可以把销量⽤“下单数、订单取消率、退货率”等三个维度去量化,下单数=咨询数 *(1-咨询流失率)+浏览量 *(1-浏览流失率);订单取消率=⽀付取消数/下单数;
退货率=订单退货数/已⽀付订单数;所以⼜会引出“咨询流失率、浏览流失率、⽀付取消数、订单退货数”等多个衡量指标。
经过这样⼀层⼀层公式化的量化,到那些“最⼩不可分割的指标”,进⽽最可能发现本质的问题所在了。
18.如果近期
如果近期贝壳⼆⼿房成交量下跌,怎么分析(贝壳房)
18.
参考答案
⾸先,按照省市、价格区间等维度划分,到是哪个维度下的⼆⼿房成交量下跌。到原因后,分内外部进⾏归因,内部包括产品侧、运营侧和技术测。外部包括宏观经济政策和竞品分析。
答案解析
定位原因+内外部分析
⽤滴滴的⾏为情况,问你⽤哪些数据做分析,⽅案的优缺点,可⾏性,效益这类问题(滴滴出⾏)
19.
19.⽤
参考答案
哪些数据做分析:指标体系搭建。采⽤“⼈货场”场景化搭建指标体系。“⼈”数据指标主要看发单⽤户数、完单⽤户数、客单价、周期内完单订单数、取消订单数、评价订单数等。“货”数据指标主要看成交了多少,交易额多少,花了多少,到具体数据指标主要会看GMV、成交率、取消率指标等等。“场”数据指标主要看哪个渠道⽤户点击量⼤曝光率⼤,带来了多少新⽤户,完成多少交易订单,客单价是多少。
⽅案的优缺点可⾏性等可以采⽤AB实验才量化。
具体步骤:
1. 收集指标,建⽴评估指标体系。
2. 设置实验组和对照组,分配流量。
3. 假设检验,评估实验结果是否显著。
4.给出决策⽅案。
答案解析
指标体系问题+ab实验步骤
总体转化率下降,但是其余各渠道转化率正常,应该怎么进⾏分析?(猿辅导)
20.
20.总体转化率下降,但是其余各渠道转化率正常,应该怎么进⾏分析?(
参考答案
这是⾟普森悖论问题,多组数据分别讨论时都会满⾜某种性质,可是⼀旦合并考虑,却可能导致相反的结论。要更客观分析产品的转化率情况,就需要设⽴更多⾓度去综合评判。也就是对⽤户进⾏更细致的划分。
答案解析
解释什么是⾟普森悖论问题+解决⽅法
业务与⽤户分析-5
某⽇营收下滑30%怎么分析?(⽃鱼)
21.某⽇营收下滑30%怎么分析?(
手机总是闪退是什么原因21.
参考答案
⾸先验证数据的准确性,确定数据异常不是因为统计⼝径或数据报表异常所导致的。随后,各维度进
⾏拆解,到是哪个维度的收⼊下降显著。最后定位问题维度后通过内外部分析到原因,内部从产品、技术和运营侧原因,外部从政策经济和竞品原因。
下滑严重怎么分析(拼多多)
22.GMV下滑严重怎么分析(
22.GMV
参考答案
⾸先确定是相⽐于何时下滑,是环⽐上⽉、同⽐去年某⽉、环⽐去年还是环⽐上周等下滑,通过时间的⽐较初步可以判断出下滑是否由于季节、节⽇、突发性事件和天⽓等影响。
随后按照公式拆解,GMV = 购买⼈数 * 客单价 * 购买次数,由此判断是购买⼈数下滑,还是客单价下滑,还是购买次数下滑。
若购买⼈数下滑,则将购买⼈数进⾏漏⽃细分,购买⼈数= 流量 * 进店转化率 * 购物车转化率 * 付款转化率,判断是漏⽃的哪个环节出现了下滑。若流量下滑,则要重视拉新;若进店转化率下滑,则要重视营销活动等。若客单价和购买次数下滑,则可以将客户进⾏细分,如分为⾼价值⽤户和低价值⽤
户;忠诚⽤户和⼀般⽤户;新⽤户和⽼⽤户;⾼频购买⽤户和低频购买⽤户,判断是哪类⽤户的客单价和购买次数下滑了。定位问题所在后,从产品、运营和技术侧分别原因,也可以从外部政策和竞品原因。
23.DAU下降5%怎么分析(快⼿)
参考答案
⾸先验证数据的准确性,确定数据异常不是因为统计⼝径或数据报表异常所导致的。随后两步分析法:⾸先定位问题原因,这⾥可以通过计算各个维度DAU的变动系数=(该维度下异常前DAU-该维度下异常后DAU)/该维度下异常前DAU,选出变动系数较⼤的前⼏个维度,对其进⾏分析。然后可以从内部和外部进⾏分析,内部从产品(版本更新)、技术(卡顿,闪退)、运营(运营活动)分别沟通看是否能到原因。外部从政策和竞品的⾓度原因。
答案解析
确定问题+定位问题+到原因
留存率下降该如何分析(拼多多)
24.留存率下降该如何分析(
24.
参考答案
⾸先,明确什么留存率下降,以及下降标准(对⽐什么下降了)。例如次⽇新增⽤户留存率下降。次⽇新增⽤户留存率= 当天新注册⽤户次⽇仍登录数 / 当天新注册⽤户数。⾸先定位问题原因,是分⼦变动过⼤还是分母变动过⼤。随后进⾏内外部分析,内部可以从产品和运营的⾓度,例如版本机型不兼容、闪退、权限获取情况等原因。外部从竞品的⾓度分析。
25.爱奇艺想要提⾼付费会员数,应从哪⼏个⽅⾯分析。(拼多多)
参考答案
内部和外部进⾏分析。
内部:从未付费⽤户,持续付费⽤户,流失付费⽤户。分别分析这些⽤户的付费率情况,以及如何提⾼对应⽤户的付费意愿。
外部:竞品⽤户。分析竞品的付费⽤户情况,可以从外部购买数据或数据爬⾍等⽅法获取,分析这些⽤户能否转化为爱奇艺的付费⽤户。
26.给⼀张流量表,怎么识别不同渠道的变化?(
给⼀张流量表,怎么识别不同渠道的变化?(拼多多)
26.
参考答案
取数的时候对groupby不同的渠道进⾏聚合。变化的话看不同渠道的影响系数=(该渠道变化前指标-该渠道变化后指标)/总的变化前指标,就可以量化⽐较不同渠道变化带来的影响。
分析⼀个case,case背景是陌陌换了匹配算法,要做abtest(字节跳动)
6.6.分析⼀个case,case背景是
参考答案
关键指标:匹配后互动成功率
相关指标:DAU、⽤户在线时长,次均聊天时长、⽤户付费率、各类功能的使⽤情况
负向指标:⽤户流失率
7.算法部门上线了新的推荐算法,在ab-test中败给了⽼算法,让你出其中的原因,需要说出具体思路和框架(拼多多)
参考答案
电商平台的商品推荐中,商品历经曝光、点击、加购物车、下单这⼀系列漏⽃。应该分别⽐较两个算法推荐商品在各环节的转化率,并针对不同环节寻原因。如果较⽼算法⽽⾔,新算法推的商品从曝光⾄点击的转化率很低,则应该从推荐推送客的画像思考,说明推荐算法推送的商品并不适合推送的客,以此为依据重新调整算法逻辑。
简要介绍AB测,并给出样本量计算公式。(拼多多、携程)
8.8.简要介绍AB测,并给出样本量计算公式。(
参考答案
AB实验经常运⽤在活动策略是否有效的问题上,进⾏实验的步骤是:实验的流程:确定⽬标和假设->确定指标->确定实验单位->计算样本量->实施测试->分析实验结果
其中样本量的计算是⽐较重要的内容,A/B 测试所需的时间 = 总样本量 /每天可以得到的样本量。从公
式就能看出来,样本量越⼩,意味着实验所进⾏的时间越短。在实际业务场景中,时间往往是最宝贵的资源,毕竟,快速迭代贵在⼀个“快”字。另外,我们做 A/B 测试的⽬的,就是为了验证某种改变是否可以提升产品、业务,当然也可能出现某种改变会对产品、业务造成损害的情况,所以这就有⼀定的试错成本。那么,实验范围越⼩,样本量越⼩,试错成本就会越低。实践和理论上对样本量的需求,其实是⼀对⽭盾。所以,我们就要在统计理论和实际业务场景这两者中间做⼀个平衡:在 A/B 测试中,既要保证样本量⾜够⼤,⼜要把实验控制在尽可能短的时间内。样本量的计算公式如下:
9.拼多多最近在测试两个不同的推荐算法,其中A⽐B好,从哪⼏个⽅⾯可以分析好的原因。(拼多多)
参考答案
关键指标提升:A组⽤户下单转化率明显⾼于B组
相关指标正向:A组⽤户⼈均订单量增加、GMV提升、⽤户活跃时间更长、物品的收藏率和分享率更⾼、⽤户拉新拉活数量更多
负向指标减少:A组⽤户退款率下降、⽤户差评率降低
10.ABtest, 为了提⾼点击率,对界⾯进⾏了⼩幅度修改,有两个组⼀组1000个⼈,有100个⼈点击,另⼀组1000个⼈,120⼈点击,怎么判断好不好(拼多多)
参考答案
在⽐例类别指标的假设检验中,可以使⽤卡⽅检验⽅法。⾸先进⾏假设,设H0为两组实验的点击率⽆明显差异,H1为第⼆组点击率要⾼于第⼀组。在该实验中,A组1000⼈中有100⼈点击,则点击率为10%,置信区间为[8.3%, 12%];B组1000⼈中有120⼈点击,则点击率为12%,置信区间为[10.1%, 14.2%],在95%的置信度下,进⾏计算得到p-value=0.15>0.05,不能拒绝原假设H0,因此认为两组点击率⽆明显差异。
答案解析
卡⽅检验:卡⽅检验是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡⽅值的⼤⼩,如果卡⽅值越⼤,⼆者偏差程度越⼤;反之,⼆者偏差越⼩;
若两个值完全相等时,卡⽅值就为0,表明理论值完全符合。
11.
有没有接触过ABtest/经验,请说说对他的理解(滴滴、快⼿、字节跳动)
11.有没有接触过ABtest/经验,请说说对他的理解(
参考答案
AB实验经常运⽤在活动策略是否有效的问题上,它的理论基础是假设检验,也就是选择⼀种合适的检验⽅法,去验证在 A/B 测试中我们提出的
假设是否正确。现在,你只要知道“假设检验”中,最重要也最核⼼的是“检验”就可以了,因为选取哪种检验⽅法,取决于指标的统计属性。
A/B 测试是促进业务持续增长的最实⽤、最有效的⽅式。
12.选择AB实验的样本的时候,应该注意什么(
选择AB实验的样本的时候,应该注意什么(滴滴)
12.
参考答案
选择AB实验的样本的时候,我们最要考虑的是样本量的选择,影响样本量选择通常有4个因素:显著性⽔平(α)、标准差(1 – β)、统计功效(μA-μB)、均值差异(σ)
● 显著性⽔平:显著性⽔平越低,对AB实验结果的要求也就越⾼,越需要更⼤的样本量来确保精度
● 统计功效:统计功效意味着避免犯⼆类错误的概率,统计功效越⼤,需要的样本量也越⼤
● 均值差异:如果真实值和测试值的均值差别巨⼤,也不太需要多少样本,就能达到统计显著
● 标准差:标准差越⼩,代表两组差异的趋势越稳定。越容易观测到显著的统计结果
将这四个值带⼊样本计算量公式就能得到需要的样本量,通常有⽹站专门计算AB实验的样本量,所以只要搞清楚上⾯四个值,就能计算出你需要的样本量
答案解析
这道题主要是对AB实验样本量选择的考量,因为在选择样本的时候最关键也是最重要的⼀步就是对样本量的选择,对于有经验的⼈来说可以按照经验判断样本量级,但是对于更多⼈来说还是需要有更多
辅助的判断。通常来说样本量太少,实验结果不⼤可信,但是样本量太多,也不是更好,⼀个最直接的原因就是样本量越⼤,影响的⽤户越多,就有可能影响到⽤户对产品的体验。
如何设计ABtest确定此功能上线收益(正负收益平衡点)(快⼿)
13.如何设计ABtest确定此功能上线收益(正负收益平衡点)(
13.
参考答案
1. A⽅案和B⽅案,哪个⽅案的结果更好?
⾸先的话,需要做需要运⽤假设检验,分为两种不同的检验⽅式,对于留存率、渗透率等漏⽃类,采⽤卡⽅检验。对于⼈均时长类等均值类指标,采⽤t检验。
2. 通过假设检验后,如果结论置信,我们就能够得到A⽅案和B⽅案哪个指标更好(有显著性差异), 对于不置信的结论,尽管A⽅案和B⽅案 的指标可能略有差异,但可能是数据正常波动产⽣。哪个 ROI 更⾼?
⼀般有活动相⽐⽆活动,留存、⼈均时长等各项指标均会显著。
对于ROI 的计算,成本⽅⾯,每个实验组成本可以直接计算,对于收益⽅⾯,就要和对照组相⽐较,假定以总⽇活跃天(即 DAU 按⽇累计求和)作为收益指标,需要假设不做运营活动,DAU 会是多少,可以通过对照组计算,即:
● 实验组假设不做活动⽇活跃天 = 对照组⽇活跃天 * (实验组流量 / 对照组流量)
● 实验组收益 = 实验组⽇活跃天 - 实验组假设不做活动⽇活跃天
这样就可以量化出每个⽅案的ROI。
答案解析
这道题主要是考察ABtest上线后,从哪些维度来确认哪个⽅案更好,或者说新的⽅案是否⽐旧的⽅案更加适合上线根据上⾯说的改进点做AB测试,从什么⾓度来分析?(⼩红书)
14.根据上⾯说的改进点做AB测试,从什么⾓度来分析?(
14.
参考答案
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论