Z-因子
目录
简介
Z-因子是统计效应大小的度量。 它已被提议用于高通量筛选(也称为 Z-prime),通常写为 Z’ 以判断特定测定中的响应是否足够大以值得进一步关注。
背景
在高通量筛选中,实验人员经常将大量(数十万到数千万)未知样本的单次测量值与阳性和阴性对照样本进行比较。 实验条件和测量的特定选择称为测定。 大屏幕在时间和资源上都很昂贵。 因此,在开始大屏幕之前,使用较小的测试(或试点)屏幕来评估分析的质量,以试图预测它是否适用于高通量设置。 Z-因子是一种尝试量化特定分析在全面、高通量筛选中的适用性的尝试。
定义
Z-因子由四个参数定义:正 (p) 和负 (n) 的均值 ( μ {displaystyle mu } ) 和标准差 ( σ {displaystyle sigma } ) ) 控制 ( μ p {displaystyle mu _{p}} , σ p {displaystyle sigma _{p}} , 和 μ n {displaystyle mu _{n}} , σ n {displaystyle sigma _{n}} )。 给定这些值,Z-因子定义为:
Z-因子 = 1 − 3 ( σ p + σ n ) | μ p − μ n | {displaystyle {text{Z-因子}}=1-{3(sigma _{p}+sigma _{n}) over |mu _{p}- 亩 _{n}|}}
实际上,Z-因子是根据样本均值和样本标准差估计的
估计 Z-因子 = 1 − 3 ( σ ^ p + σ ^ n ) | μ ^ p – μ ^ n | {displaystyle {text{估计的 Z-因子}}=1-{3({hat {sigma }}_{p}+{hat {sigma }}_{n} ) over |{hat {mu }}_{p}-{hat {mu }}_{n}|}}
解释
以下对Z-因子的解释摘自:
请注意,根据许多类型的实验标准,零 Z-因子表示效果大小较大,而不是如上文所建议的边缘无用结果。 例如,如果 σp=σn=1,则 μp=6 和 μn=0 给出零 Z-因子。 但对于具有这些参数的正态分布数据,阳性对照值小于阴性对照值的概率小于 105 分之一。由于进行了大量测试,因此在高通量筛选中使用极端保守主义。
限制
Z-因子定义中的常数因子 3 是由正态分布驱动的,其中超过 99% 的值出现在均值的 3 个标准差范围内。 如果数据遵循强烈的非正态分布,则参考点(例如负值的含义)可能会产生误导。 另一个问题是,通常对均值和标准差的估计并不可靠; 因此,高通量筛选社区的许多用户更喜欢 Robust Z-prime,它用中位数代替平均值,用中位数xxx偏差代替标准偏差。

阳性或阴性对照中的极端值(离群值)会对 Z-因子产生不利影响,即使在实际筛选中该测定表现良好,也可能导致明显不利的 Z-因子。此外,应用单个 Z-因 以因子为基础的标准将两个或多个具有不同强度的阳性对照用于同一测定中会导致误导的结果。 Z-因子中的xxx符号不方便从数学上推导Z-因子的统计推断。 最近提出的统计参数,严格标准化均值差 (SSMD),可以解决这些问题。 SSMD 的一种估计对异常值具有稳健性。