实战医学统计

微信扫描二维码,关注我的公众号

Pilot 预试验样本量计算器 BMJ 2025;390:e083405 取每个模块中的最大值max作为最后预试验N
参数设置
曲线设置(PASS风格叠加)
图为“CI 半宽 vs n”。叠加不同 p,可直观看到在不同预期比例下所需精度。
曲线设置(PASS风格叠加)
图为“CI 半宽 vs 观察单位 T”。叠加不同 λ,观察相同精度目标下需要多长观察期。
结果 + 曲线(PASS风格)
方法学说明(CI 精度驱动)

目标是以预设精度估计可行性参数(feasibility parameter)。统计学上通过设定置信区间半宽(half-width)来约束样本量:精度越高(半宽越小),所需样本越大。

  • 二分类(比例) :用比例的 CI 宽度/半宽来求 n;可选单侧或双侧。
  • 计数/率(Poisson) :以发生率/招募率为参数,按 Poisson 率的 CI 精度推算需要的观察单位数(如需要观察多少“月/周”)。

临床解释:这里的 n 不是为了检测疗效差异,而是为了让招募率、脱落率等关键运营参数的估计足够精确,从而更可靠地规划正式试验。

参数设置
Power 曲线设置(PASS风格叠加)
阅读方式:横轴为 n(或 p_true),纵轴为 Power;虚线为目标 Power=1-β;圆点为当前输入参数下的推荐点。
Power 曲线设置(PASS风格叠加)
阅读方式:横轴为 T(或 λ_true),纵轴为 Power;虚线为目标 Power=1-β;圆点为当前输入参数下的推荐点。
结果 + Power 曲线(PASS风格)
方法学说明(红绿灯阈值 / progression criteria)

该方法用于把 pilot 变成明确的 Go/Amend/Stop 决策闸门。核心是为同一可行性参数设定两个阈值:最低阈值(minimum)与目标阈值(goal)。

  • 统计学建模 :用单侧假设检验把 H0 设为 minimum、H1 设为 goal,并给定 α 与 power(1-β)。
  • 临床解释 :若点估计 ≥ goal → Go;若 ≤ minimum → Stop;介于两者 → Amend(需要修改流程/设计)。

提示:若同时设置多个进展指标,每个都按 80% power 设计会降低“全部达标”的联合概率;应适当提高单项 power(如 90%)以保持总体把握度。

参数设置
曲线设置(PASS风格叠加)
图为“Pr(≥1次问题) vs n”。颜色表示不同 π。
结果 + 概率曲线(PASS风格)
方法学说明(至少观察到一次问题)

用于暴露低频但关键的可行性问题(流程故障、额外昂贵评估等)。设定最低问题概率 π 与希望观察到至少一次问题的把握度 γ,则所需样本量满足:Pr(≥1)=1-(1-π)^n ≥ γ。

临床解释:没观察到问题 ≠ 问题不存在;只能说明真实概率可能低于设定的 π。

参数设置
UCL 方法(基于方差上置信限膨胀)

NCT 方法(非中心 t 膨胀)
U 型曲线设置(PASS风格叠加)
图为“总样本量(pilot+definitive) vs pilot 每组样本量”。颜色表示不同 d;分面表示 UCL / NCT。
结果 + U 型曲线(PASS风格)
方法学说明(最小化 pilot+definitive 总样本量)

pilot 做大一点可提升方差估计稳定性,从而减少对正式试验样本量的保守膨胀;但 pilot 太大又会抬高总投入。总样本量通常呈 U 形曲线,存在一个“总量最小”的 pilot 规模。

临床解释:这相当于在“前期试错成本”和“后期规模成本”之间寻找最省资源的折中点。

参数设置
结果与可解释性
方法学说明(排除低可能获益)
方法学说明(排除低可能获益)

不是做显著性检验,而是让 pilot 的单侧 CI 半宽足够小,从而在“真实无效”附近也能排除达到最小临床重要差异的可能性。

临床解释:这是一种早期筛选策略——更快淘汰不太可能产生临床获益的干预,但会有一定错杀风险(例如 80%CI 对应约 20% 的错杀概率)。