coddirection = {c: codon_ratios.loc[self.tissue, c] > 0 if np.abs( codon_ratios.loc[self.tissue, c]) > threshold else np.nan for c in aa_codons} codonprob[aa] = {c: [codweights[c] / sumweights, coddirection[c]] for c in aa_codons}
时间: 2024-03-15 18:42:04 浏览: 19
这是一个Python代码段,它的功能是为每个氨基酸计算其对应的密码子的概率和方向。具体来说,它首先定义了一个字典`coddirection`,其中每个密码子的值都是一个布尔类型的值,表示该密码子在给定的组织中是否具有偏向性。如果该密码子的偏向性大于阈值,则将其值设置为True,否则将其值设置为NaN。接下来,它为每个氨基酸定义了一个字典`codonprob`,其中每个密码子的值都是一个列表,包含两个元素:第一个元素是该密码子出现的概率,第二个元素是该密码子在给定的组织中是否具有偏向性。其中,密码子的概率由一个名为`codweights`的字典计算得出,而该氨基酸所有密码子的概率之和则由`sumweights`计算得出。
相关问题
if any(codon_weights.loc[self.tissue, aa_codons]): weight_bkg = codon_weights.loc[self.tissue, aa_codons].mean() codweights = {c: codon_weights.loc[self.tissue, c] + weight_bkg for c in aa_codons} else: codweights = {c: codon_weights.loc[self.tissue, c] for c in aa_codons}
这段代码主要是为了计算不同氨基酸对应的密码子权重。具体来说,它使用了一个名为 "codon_weights" 的数据框来获取与氨基酸相关的密码子权重,并根据组织类型 "self.tissue" 来选择相应的行。然后,它使用一个名为 "aa_codons" 的字典来存储每个氨基酸对应的密码子列表。接着,它使用 "any" 函数来判断这些列表中是否有至少一个元素,在 "codon_weights" 数据框中存在对应的权重值。如果存在,则计算这些密码子的平均权重,并将平均权重加到每个密码子的权重值中,得到一个新的字典 "codweights"。如果不存在,则直接将每个密码子的权重值存储到 "codweights" 中。
总的来说,这段代码的作用是为了获取每个氨基酸对应的密码子权重,并将其存储到一个字典中,以便后续的处理和分析。
# "degree" determines to which extent are unclear codons optimized threshold = np.percentile(codon_ratios.loc[self.tissue, :].abs(), (1.0 - self.degree) * 100)
这段代码看起来是使用了一个名为 "degree" 的变量来确定一个阈值,该阈值用于确定不明确的密码子是否被优化。具体来说,它使用了一个名为 "codon_ratios" 的数据框来获取与组织相关的密码子比率,并计算出其绝对值的百分位数。最终的阈值是根据 (1.0 - degree) * 100 的百分比确定的。换句话说,如果 "degree" 值为 0.5,则使用的阈值将是该数据框中绝对值最低的50%的百分位数。