A/B Test

比较两种变体的统计测试

什么是A/B测试?

A/B测试是一种统计方法,用于比较两个版本(A和B),并确定哪个表现更好。这就像对您的用户进行科学实验!

您将受众分为两个组:一个看到版本 A(对照组),另一个看到版本 B(变体)。系统计算观察到的差异是否具有统计显著性。

使用示例:

  • • 测试两个版本的销售页面
  • • 比较两个营销活动的有效性
  • • 评估设计或文案更改的影响
  • • 在两种定价策略之间做出决定

快速开始

  1. 1. 将您的数据准备为 CSV 格式,并包含组(A 或 B)和结果指标。
  2. 2. 请上传文件到 上传页面
  3. 3. 设置参数(置信水平,测试类型)
  4. 4. 请稍等,正在处理(通常需要1-2分钟)
  5. 5. 分析统计结果并基于数据做出决策

如何组织您的数据

将您的数据整理成一个包含两列的CSV表格:

列 1:组

识别显示了哪个版本。使用“A”作为控制组,使用“B”作为变体。

列 2:转化/指标

行动结果(1 = 转换,0 = 不转换)或数字值(时间,收入等)

A/B测试工作表示例:

group converted
A 1
A 0
B 1
B 1

💡 提示: 每行代表一个用户或观察。成功(转化、点击、购买)用1表示,失败用0表示。

测试设置

置信水平

定义您想要多大程度上相信差异是真实的(不是偶然的)。

90% 良好的信心用于快速测试
95% 推荐的标准(平衡)
99% 对关键决策的高度信任

测试类型

选择适合您数据的统计测试:

Z检验(比例)

对于二元数据(0或1):转换、点击、购买

T检验(均值)

对于连续数值:时间、收入、数量

单尾测试 vs 双尾测试

定义测试的假设:

双尾 (two-tailed)

测试是否存在任何方向(更大或更小)的差异

单侧

测试 B 是否比 A 更好。

理解结果

测试返回的统计数据有助于决定B版本是否真的比A版本更好,或者这种差异是否只是运气。

关键指标

P值 (p-value)

偶然观察到这种差异的概率。

p < 0.05 = 显著差异! | p > 0.05 = 无显著差异

转化率

每组(A和B)的成功百分比。

例子:集团A:12%,集团B:15%(B 好25%)

置信区间

真正差异可能所在的范围。

如果不包括零,差异具有统计显著性。

效果大小 (Effect Size)

发现差异的实际大小。

小 (0.2), 中 (0.5), 大 (0.8)

⚠️ 重要: 一个统计显著的结果(p < 0.05)并不能保证对业务的影响。始终考虑效应大小和决策的实际背景。

需要帮助吗? 联系: contato@grabatus.com