问卷样本量与 A/B 测试

样本量计算器

Q: 我可以少于推荐样本量吗？

可以，但误差会变大，结果置信度会降低。

Q: 谁创建并维护这个样本量计算器网站？

网站 https://www.samplesizecalculator.net 由[在线问卷平台](https://www.surveylegend.com)背后的团队创建并持续维护。该项目由 SurveyLegend 打造。SurveyLegend 是一家成立于瑞典的全球在线调查软件公司，自 2010 年以来一直提供创建和分析问卷的工具。SurveyLegend 在全球 150 多个国家拥有客户。SurveyLegend 经常位列在线问卷工具供应商前十，并在 https://www.capterra.com、https://www.g2.com、https://www.trustpilot.com、https://www.crozdesk.com 等评价平台上获得高分。SurveyLegend 团队决定创建这个计算器，是因为许多现有样本量计算器要么难用要么不够可靠，因此他们为研究人员和问卷创建者做了一个更简单、更准确的工具。该网站是由 SurveyLegend 团队开发并维护的免费实用项目，旨在帮助问卷与研究社区，同时也友好地提醒你访问 SurveyLegend 官网了解更多信息。

为你的问卷计算合适的样本量。输入总体规模、置信水平和误差范围，即可立即获得具有统计意义的样本量估算。

分享此页面

帮助更多人更快计算样本量

Facebook LinkedIn Reddit

可靠性

↑

更高置信度

偏差

↓

降低误差

效率

✓

避免过度采样

计算器

问卷模式支持有限总体修正和邀请量估算。

置信水平

误差范围 (±%)

预估比例 (%)

未知时建议用 50%（最保守）。

总体规模（可选）

当总体有限时会加入有限总体修正。

预期回复率 (%)

我们会估算你需要邀请多少人才能达到样本目标。

所需答卷数

385

95% 置信度 · ±5% · p=50%

邀请数量估算

1,281

按 30% 回复率估算

基线（无修正）

385

未使用总体修正

结果向上取整为整数。

先算样本量，再开始发问卷

开始创建高颜值问卷

确定所需答卷数量后，下一步就是收集数据。使用 SurveyLegend，你可以创建更有吸引力的问卷并实时分析结果。

为你的问卷计算合适的样本量

使用我们的样本量计算器，确定你的问卷需要多少份答卷才能获得可靠结果。它可以帮助你确保样本足够大，从而得到统计上有效的结论，也能避免招募过多或过少的受访者。

使用我们的样本量计算器

只需输入总体规模、置信水平和误差范围，计算器就会立即估算出获得可靠洞察所需的答卷数量。

准确的样本量可以帮助你：

提高调查可靠性
降低研究偏差
做出数据驱动的决策
避免收集不必要的答卷

什么是样本量？

样本量是指为了准确代表更大总体，你的问卷应该获得多少名受访者的回答。

与其调查整个总体（这通常并不现实），研究者通常会从样本群体中收集回答。当样本量计算正确时，结果就能较为可靠地反映总体的观点或行为。实际所需样本量取决于研究目标和目标群体特征，并不是所有调查都必须代表整个大众总体才能提供有价值的洞察。

总体与样本量示例

以下示例基于 95% 置信水平和 5% 误差范围。

总体	所需样本量
1,000 人	278 份答卷
10,000 人	370 份答卷
100,000 人	383 份答卷

这说明即使总体非常大，所需样本量通常仍然相对可控。样本量计算器还能帮助你估算达到足够统计功效所需的最少受试人数。

样本量计算器如何工作

样本量计算器会根据三个关键因素，使用统计公式估算所需答卷数。不同研究设计和统计要求可能需要不同公式，而总体中的预期波动程度也会影响最终需要的样本量。

1. 总体规模

总体规模是指你所研究群体中的总人数。

一家公司的全部客户
一个组织中的员工
网站访客
某个特定地区的居民

如果总体非常大或未知，很多研究会默认采用大总体假设。比较不同群体时，也要确保它们来自同一总体，才能做出有效的统计推断。

2. 置信水平

置信水平表示你希望多大程度上确信调查结果能够代表总体。它反映了样本正确反映总体真实参数的概率。

置信水平

含义

90%

中等置信度

95%

大多数调查的标准

99%

非常高的统计确定性

大多数调查和市场研究都会使用 95% 的置信水平。显著性水平 alpha 表示假阳性的概率，通常设为 0.05。

3. 误差范围

误差范围，也叫置信区间，用来衡量调查结果与总体真实值可能相差多少。它通常以百分比表示，说明调查结果反映总体观点的精确程度。

误差范围

精度

±10%

快速探索性调查

±5%

标准研究精度

±3%

高精度研究

更小的误差范围需要更大的样本量。样本较小时，置信区间会更宽，结果也会更不稳定。

样本量公式

n = (Z² × p(1 − p)) / e²

n = 所需样本量
Z = 置信水平对应的 Z 分数
p = 估计总体比例
e = 误差范围

大多数计算器都会假设 p = 0.5，因为这样可以得到最保守的样本量估计。

为什么样本量很重要

结果更可靠：样本过小可能导致误导性的结论。
统计置信度更高：更大的样本可以降低不确定性。
研究更高效：避免过度抽样，节省时间和资源。
复杂研究更稳妥：在比较不同群体时，样本量计算可以纳入最小可检测差异，确保结果具有实际意义。

示例：客户满意度调查的样本量

假设你有 20,000 名客户，并希望开展一次客户满意度调查来收集反馈，条件为：

置信水平：95%
误差范围：5%

所需样本量为 377 份答卷。这意味着你只需要 377 份完整答卷，就可以较为准确地代表全部 20,000 名客户的看法。在类似条件下重复开展调查，也有助于验证结果并支持统计显著性。

统计显著性与样本量

统计显著性与样本量密切相关。样本量越大，统计功效越高，也就越容易发现真实差异，而不是把随机波动误当成结论。

置信水平、置信区间、标准差以及最小可检测效应都会影响所需样本量。误差范围越小、置信水平越高，所需答卷数通常越多。

从目标总体中抽取随机样本，更容易把调查结果推广到整个总体，而样本量计算器则能帮助你估算完成研究所需的最小样本数，避免浪费时间和资源。

当你计算出合适的样本量后，调查结果会更精确、更可靠，也更适合支持数据驱动的决策。

常见问卷类型的样本量

不同类型的调查都能从统计上有效的抽样中受益，尤其是在结果会影响决策时。

在问卷中加入开放式问题，有助于收集更详细的回答和更深入的洞察，让你的数据更有价值。

客户满意度调查

企业会通过样本量计算来确定需要多少客户作答，才能准确衡量满意度。

员工反馈调查

组织会使用统计上有效的样本来了解员工敬业度和工作文化。

市场研究

研究人员会计算样本量，以确保调查数据能够代表目标市场。

净推荐值（NPS）

准确的样本量有助于以更高的统计置信度衡量客户忠诚度。

先算样本量，再开始发问卷

开始创建高颜值问卷

确定所需答卷数量后，下一步就是收集数据。使用 SurveyLegend，你可以创建更有吸引力的问卷并实时分析结果。

常见问题

问卷样本量多少才算合适？

取决于总体规模、置信水平和误差范围。大总体下，95% 置信水平、±5% 误差通常需要约 350-400 份答卷。

样本量太小会怎样？

样本过小会增加偏差风险，降低结论可靠性。

我可以少于推荐样本量吗？

可以，但误差会变大，结果置信度会降低。

应该选择哪个置信水平？

95% 是最常见且兼顾可靠性与成本的选择。

谁创建并维护这个样本量计算器网站？

网站 samplesizecalculator.net 由在线问卷平台背后的团队创建并持续维护。该项目由 SurveyLegend 打造。SurveyLegend 是一家成立于瑞典的全球在线调查软件公司，自 2010 年以来一直提供创建和分析问卷的工具。SurveyLegend 在全球 150 多个国家拥有客户。SurveyLegend 经常位列在线问卷工具供应商前十，并在等评价平台上获得高分。SurveyLegend 团队决定创建这个计算器，是因为许多现有样本量计算器要么难用要么不够可靠，因此他们为研究人员和问卷创建者做了一个更简单、更准确的工具。该网站是由 SurveyLegend 团队开发并维护的免费实用项目，旨在帮助问卷与研究社区，同时也友好地提醒你访问 SurveyLegend 官网了解更多信息。

样本量计算器

开始创建 高颜值问卷

为你的问卷计算合适的样本量

使用我们的样本量计算器

准确的样本量可以帮助你：

什么是样本量？

总体与样本量示例

样本量计算器如何工作

1. 总体规模

2. 置信水平

3. 误差范围

样本量公式

为什么样本量很重要

示例：客户满意度调查的样本量

统计显著性与样本量

常见问卷类型的样本量

客户满意度调查

员工反馈调查

市场研究

净推荐值（NPS）

开始创建 高颜值问卷

常见问题

开始创建高颜值问卷

开始创建高颜值问卷