注释 ori_geno1 = pd.read_csv("randLst1.original_gt.txt", header=None) miss1 = ori_geno1[ori_geno1[0] =="./."].shape[0]
时间: 2023-04-08 15:02:57 浏览: 176
这是一个关于 Python 代码的问题,我可以回答。这段代码是在读取一个名为 "randLst1.original_gt.txt" 的 CSV 文件,并将其存储在名为 "ori_geno1" 的 Pandas 数据帧中。接下来,代码计算了数据帧中值为 "./." 的行数,并将其存储在名为 "miss1" 的变量中。
相关问题
def phased_geno_ACC(randLst1, randLst2): from tqdm import tqdm rand1 = pd.read_csv(randLst1,header=None) rand2 = pd.read_csv(randLst2,header=None) ori_geno1 = pd.read_csv("randLst1.original_gt.txt", header=None) miss1 = ori_geno1[ori_geno1[0] =="./."].shape[0] ori_geno2 = pd.read_csv("randLst2.original_gt.txt", header=None) miss2 = ori_geno2[ori_geno2[0] =="./."].shape[0] phased_geno1 = open("randLst1.phase.gt.txt", "w") phased_geno2 = open("randLst2.phase.gt.txt", "w") ACCfile = open("imputed_ACC.result.txt", "w") total_1 = imputedVcf.shape[0] - miss1 total_2 = imputedVcf.shape[0] - miss2 right1 = 0 right2 = 0 for row in tqdm(range(imputedVcf.shape[0])): print(imputedVcf.iloc[row, rand1.iloc[row, 0]], file = phased_geno1) print(imputedVcf.iloc[row, rand2.iloc[row, 0]], file = phased_geno2) if ori_geno1.iloc[row, 0] == imputedVcf.iloc[row, rand1.iloc[row,0]].replace("|", "/"): right1 += 1 if ori_geno2.iloc[row, 0] == imputedVcf.iloc[row, rand2.iloc[row,0]].replace("|", "/"): right2 += 1 ACC1 = right1 / total_1 ACC2 = right2 / total_2 print(f"regarding missing site as wrongness, the total masked site is {total_1} and {total_2}\n ACC1 site is {right1} and ACC2 site is {right2}\nimputed genotype ACC1 is {ACC1} and ACC2 is {ACC2}", file=ACCfile) phased_geno_ACC("randLst1.txt", "randLst2.txt")
这是一个关于 Python 编程的问题,我可以回答。这段代码是一个函数,名为 phased_geno_ACC,它接受两个文件名作为参数,这两个文件包含随机数列表。函数会读取这些文件,并使用随机数从另一个文件中读取数据。然后,函数会将读取到的数据写入两个文件中,并计算准确率。最后,函数会将结果写入一个文件中。
ori_df = pd.read_excel(in_file) refer_df = pd.read_excel(in_file, sheet_name=1) filtered_df = refer_df.join(ori_df.set_index(ori_df.columns[0]), on=refer_df.columns[0], how='inner')
这是一段 Python 代码,它的作用是什么?
这段代码首先通过 Pandas 库读取一个 Excel 文件,并将其存储到一个名为 ori_df 的变量中。然后,它使用同样的方法读取同一文件的第二个工作表,并将其存储到一个名为 refer_df 的变量中。
接下来,代码通过 join() 函数将 refer_df 和 ori_df 进行连接,连接的方式是将 refer_df 的第一列与 ori_df 的第一列进行匹配,并返回匹配后的结果。具体来说,ori_df.set_index(ori_df.columns[0]) 的作用是将 ori_df 的第一列设置为索引列,然后 on=refer_df.columns[0] 指定了用 refer_df 的第一列进行匹配。最后,how='inner' 表示只保留匹配后的结果,即两个表格中都存在的行。结果被存储在 filtered_df 变量中。
阅读全文