Python-100-Days/Day66-70/参数估计.md

1.3 KiB
Raw Blame History

参数估计

推断型统计的核心就是用样本推测总体。在实际生产环境中,可能无法获得所有的数据,或者即便获取了所有的数据,但是没有足够的资源来分析所有的数据,在这种情况下,我们都需要用非常小量的样本特征去评估总体数据的特征,这其中的一项工作就是参数估计。

参数估计应用的场景非常的多,例如:

  1. 在产品侧我们可以用参数估计的方式评估A/B测试的效果。
  2. 在运营侧,我们可以用参数估计的方式优化活动配置和推荐策略。
  3. 在市场侧,我们可以用参数估计的方式制定广告投放策略。

实施步骤

  1. 确定分析的置信水平

  2. 确定估计的参数类型

  3. 计算参数估计的区间

    • 数值型指标:A = z \times 样本标准差 / \sqrt{样本数量},其中 z 的值可以通过查表得到如果置信水平选择95%,那么 z 的值就是1.96。大部分运营指标都是数值型指标例如DAU、ARPU、转化率等。
    • 占比型指标:A = z \times \sqrt{占比 \times (1 - 占比) / 样本数量}z 值同上。占比型指标如性别占比、渠道占比、品类占比等。

    最终得到的估计区间就是:[样本均值 - A, 样本均值 + A]