经过了upper-quartile normalized counts converted to log2-transformed RPKM values处理过程,如何处理才能获得最原始的RPKM
时间: 2024-04-02 16:35:11 浏览: 16
经过了upper-quartile normalized counts converted to log2-transformed RPKM values处理过程得到的结果是log2-transformed RPKM值。要获得最原始的RPKM值,需要进行逆运算,即将log2-transformed RPKM值转换为RPKM值。具体步骤如下:
1. 对于每一个基因,将其log2-transformed RPKM值进行反向转换,即将其先按照2的指数幂次方进行反转换,再将其除以该基因的长度(或者乘以1,000,000,具体取决于RPKM值的计算方法)。
2. 得到的结果即为原始的RPKM值。需要注意的是,该计算方法仅适用于原始的RPKM计算方法。如果使用其他的方法计算RPKM值,则需要根据具体的计算方法进行相应的调整。
需要注意的是,RPKM值是一种相对定量的表达量测量值,其值的大小取决于样本的reads数和基因的长度,因此不同样本或不同基因之间的RPKM值不能直接进行比较。如果需要比较不同样本或不同基因之间的表达量差异,可以使用其他的表达量测量方法,如TPM(Transcripts Per Million)或FPKM(Fragments Per Kilobase Million)。
相关问题
这一系列的步骤的逆运算是啥upper-quartile normalized counts converted to log2-transformed RPKM values
逆运算即为将log2-transformed RPKM values转换为upper-quartile normalized counts。具体步骤如下:
1. 对于每一个基因,将其log2-transformed RPKM values乘以该基因的长度(或者除以1,000,000,具体取决于RPKM值的计算方法)得到基因的reads数。
2. 计算所有基因的reads数的75%分位数,即upper-quartile value。这里需要注意的是,upper-quartile value是对所有基因的reads数进行统计,而不是对每一个样本单独计算。
3. 对于每一个样本,在每一个基因的reads数上除以该样本的upper-quartile value,得到upper-quartile normalized counts。
4. 将upper-quartile normalized counts进行逆变换,即将其除以该基因的长度(或者乘以1,000,000),得到原始的counts值。
需要注意的是,该逆运算仅适用于原始的RPKM计算方法。如果使用其他的方法计算RPKM值,则需要根据具体的计算方法进行相应的调整。
upper-quartile normalized的逆运算计算过程
假设我们有一个经过upper-quartile normalization处理的数据集 $Y=[y_1,y_2,\cdots,y_n]$,而且我们知道这个数据集的第三四分位数 $q_3$。现在我们需要对 $Y$ 进行逆运算,恢复出原始的数据集 $X=[x_1,x_2,\cdots,x_n]$。
根据upper-quartile normalization的定义,我们可以得到:
$$
y_i = \log_{10} \frac{x_i}{q_3} \Rightarrow x_i = q_3 \times 10^{y_i}
$$
因此,我们只需要对 $Y$ 中的每个元素 $y_i$ 进行逆变换即可得到 $X$:
$$
X = [q_3 \times 10^{y_1},q_3 \times 10^{y_2}, \cdots, q_3 \times 10^{y_n}]
$$
其中 $y_i$ 是 $Y$ 中第 $i$ 个元素。这就是upper-quartile normalized的逆运算计算过程。