A/B Test
比较两种变体的统计测试
什么是A/B测试?
A/B测试是一种统计方法,用于比较两个版本(A和B),并确定哪个表现更好。这就像对您的用户进行科学实验!
您将受众分为两个组:一个看到版本 A(对照组),另一个看到版本 B(变体)。系统计算观察到的差异是否具有统计显著性。
使用示例:
- • 测试两个版本的销售页面
- • 比较两个营销活动的有效性
- • 评估设计或文案更改的影响
- • 在两种定价策略之间做出决定
快速开始
- 1. 将您的数据准备为 CSV 格式,并包含组(A 或 B)和结果指标。
- 2. 请上传文件到 上传页面
- 3. 设置参数(置信水平,测试类型)
- 4. 请稍等,正在处理(通常需要1-2分钟)
- 5. 分析统计结果并基于数据做出决策
如何组织您的数据
将您的数据整理成一个包含两列的CSV表格:
列 1:组
识别显示了哪个版本。使用“A”作为控制组,使用“B”作为变体。
列 2:转化/指标
行动结果(1 = 转换,0 = 不转换)或数字值(时间,收入等)
A/B测试工作表示例:
| group | converted |
|---|---|
| A | 1 |
| A | 0 |
| B | 1 |
| B | 1 |
💡 提示: 每行代表一个用户或观察。成功(转化、点击、购买)用1表示,失败用0表示。
测试设置
置信水平
定义您想要多大程度上相信差异是真实的(不是偶然的)。
测试类型
选择适合您数据的统计测试:
Z检验(比例)
对于二元数据(0或1):转换、点击、购买
T检验(均值)
对于连续数值:时间、收入、数量
单尾测试 vs 双尾测试
定义测试的假设:
双尾 (two-tailed)
测试是否存在任何方向(更大或更小)的差异
单侧
测试 B 是否比 A 更好。
理解结果
测试返回的统计数据有助于决定B版本是否真的比A版本更好,或者这种差异是否只是运气。
关键指标
P值 (p-value)
偶然观察到这种差异的概率。
p < 0.05 = 显著差异! | p > 0.05 = 无显著差异
转化率
每组(A和B)的成功百分比。
例子:集团A:12%,集团B:15%(B 好25%)
置信区间
真正差异可能所在的范围。
如果不包括零,差异具有统计显著性。
效果大小 (Effect Size)
发现差异的实际大小。
小 (0.2), 中 (0.5), 大 (0.8)
⚠️ 重要: 一个统计显著的结果(p < 0.05)并不能保证对业务的影响。始终考虑效应大小和决策的实际背景。
需要帮助吗? 联系: contato@grabatus.com