Pilot 预试验样本量计算器

Pilot 预试验样本量计算器 BMJ 2025;390:e083405 取每个模块中的最大值max作为最后预试验N

参数设置

参数类型：

二分类（比例）计数/率（Poisson）

预期比例 p（0–1）

置信区间类型：

单侧双侧

目标半宽（half-width；如 ±10% 填 0.10）

95%CI 置信水平（如 0.95）

随机分配比（干预:对照；1 表示 1:1）

预计失访/脱落比例（用于入组数膨胀）

曲线设置（PASS风格叠加）

样本量范围 n（用于绘图）

叠加曲线：p 值（逗号分隔）

图为“CI 半宽 vs n”。叠加不同 p，可直观看到在不同预期比例下所需精度。

预期发生率 λ（例如：每月招募人数）

置信区间类型：

单侧双侧

目标半宽（与 λ 同单位；如 ±3 人/月填 3）

95%CI 置信水平（如 0.95）

曲线设置（PASS风格叠加）

观察单位范围 T（用于绘图；如月数）

叠加曲线：λ 值（逗号分隔）

图为“CI 半宽 vs 观察单位 T”。叠加不同 λ，观察相同精度目标下需要多长观察期。

结果 + 曲线（PASS风格）

方法学说明（CI 精度驱动）

目标是以预设精度估计可行性参数（feasibility parameter）。统计学上通过设定置信区间半宽（half-width）来约束样本量：精度越高（半宽越小），所需样本越大。

二分类（比例） ：用比例的 CI 宽度/半宽来求 n；可选单侧或双侧。
计数/率（Poisson） ：以发生率/招募率为参数，按 Poisson 率的 CI 精度推算需要的观察单位数（如需要观察多少“月/周”）。

临床解释：这里的 n 不是为了检测疗效差异，而是为了让招募率、脱落率等关键运营参数的估计足够精确，从而更可靠地规划正式试验。

参数设置

参数类型：

二分类（比例）计数/率（Poisson）

单侧显著性水平 α（如 0.05）

β（=1-power；如 power=0.95 则 β=0.05）

最低阈值 p0（minimum）

目标阈值 p1（goal）

Power 曲线设置（PASS风格叠加）

曲线视角：

Power vs n（PASS）反推：Power vs 真实同意率 p_true

样本量范围 n（用于绘图）

叠加曲线：真实同意率 p_true（逗号分隔；将自动包含 p0/p1）

固定样本量 n（反推图）

叠加曲线：n（逗号分隔；将自动包含推荐 n）

阅读方式：横轴为 n（或 p_true），纵轴为 Power；虚线为目标 Power=1-β；圆点为当前输入参数下的推荐点。

单侧显著性水平 α（如 0.05）

β（=1-power；如 power=0.90 则 β=0.10）

最低阈值 λ0（minimum；如 6 人/月）

目标阈值 λ1（goal；如 10 人/月）

Power 曲线设置（PASS风格叠加）

曲线视角：

Power vs 观察单位 T（PASS）反推：Power vs 真实招募率 λ_true

观察单位范围 T（用于绘图；如月数）

叠加曲线：真实招募率 λ_true（逗号分隔；将自动包含 λ0/λ1）

固定观察单位 T（反推图；如月数）

叠加曲线：T（逗号分隔；将自动包含推荐 T）

阅读方式：横轴为 T（或 λ_true），纵轴为 Power；虚线为目标 Power=1-β；圆点为当前输入参数下的推荐点。

结果 + Power 曲线（PASS风格）

方法学说明（红绿灯阈值 / progression criteria）

该方法用于把 pilot 变成明确的 Go/Amend/Stop 决策闸门。核心是为同一可行性参数设定两个阈值：最低阈值（minimum）与目标阈值（goal）。

统计学建模 ：用单侧假设检验把 H0 设为 minimum、H1 设为 goal，并给定 α 与 power（1-β）。
临床解释 ：若点估计 ≥ goal → Go；若 ≤ minimum → Stop；介于两者 → Amend（需要修改流程/设计）。

提示：若同时设置多个进展指标，每个都按 80% power 设计会降低“全部达标”的联合概率；应适当提高单项 power（如 90%）以保持总体把握度。

参数设置

把握度 γ（希望至少观察到 1 次问题事件；如 0.95）

问题事件最低概率 π（如 0.10）

预计失访/脱落比例（用于入组数膨胀）

曲线设置（PASS风格叠加）

样本量范围 n（用于绘图）

叠加曲线：π 值（逗号分隔）

图为“Pr(≥1次问题) vs n”。颜色表示不同 π。

结果 + 概率曲线（PASS风格）

方法学说明（至少观察到一次问题）

用于暴露低频但关键的可行性问题（流程故障、额外昂贵评估等）。设定最低问题概率 π 与希望观察到至少一次问题的把握度 γ，则所需样本量满足：Pr(≥1)=1-(1-π)^n ≥ γ。

临床解释：没观察到问题 ≠ 问题不存在；只能说明真实概率可能低于设定的 π。

参数设置

UCL 方法（基于方差上置信限膨胀）

最小临床重要效应（SMD d）

双侧 α（如 0.05）

β（=1-power；如 0.2）

UCL 参数（默认0.8，严苛0.9）

NCT 方法（非中心 t 膨胀）

最小临床重要效应（SMD d）

双侧 α（如 0.05）

β（=1-power；如 0.2）

U 型曲线设置（PASS风格叠加）

pilot 每组样本量上限（用于绘图）

叠加曲线：d 值（逗号分隔）

绘图方法

UCL NCT

图为“总样本量（pilot+definitive） vs pilot 每组样本量”。颜色表示不同 d；分面表示 UCL / NCT。

结果 + U 型曲线（PASS风格）

方法学说明（最小化 pilot+definitive 总样本量）

pilot 做大一点可提升方差估计稳定性，从而减少对正式试验样本量的保守膨胀；但 pilot 太大又会抬高总投入。总样本量通常呈 U 形曲线，存在一个“总量最小”的 pilot 规模。

临床解释：这相当于在“前期试错成本”和“后期规模成本”之间寻找最省资源的折中点。

参数设置

结局类型：

连续结局（均值差/标准化差异）二分类结局（比例差）

单侧 CI 水平（如 0.80 或 0.90）

最小临床重要差异MCID（作为 CI 最大半宽 w，例如 0.30）

结局方差（variance）

组间样本量比 R（治疗:对照；1 表示 1:1）

预计失访/脱落比例（用于入组数膨胀）

单侧 CI 水平（如 0.80 或 0.90）

对照组比例 p（如 0.50）

最小临床重要差异MCID（比例差；如 0.10）

预计失访/脱落比例（用于入组数膨胀）

结果与可解释性

方法学说明（排除低可能获益）

不是做显著性检验，而是让 pilot 的单侧 CI 半宽足够小，从而在“真实无效”附近也能排除达到最小临床重要差异的可能性。

临床解释：这是一种早期筛选策略——更快淘汰不太可能产生临床获益的干预，但会有一定错杀风险（例如 80%CI 对应约 20% 的错杀概率）。