注释 ori_geno1 = pd.read_csv("randLst1.original_gt.txt", header=None) miss1 = ori_geno1[ori_geno1[0] =="./."].shape[0]

这是一个关于 Python 代码的问题，我可以回答。这段代码是在读取一个名为 "randLst1.original_gt.txt" 的 CSV 文件，并将其存储在名为 "ori_geno1" 的 Pandas 数据帧中。接下来，代码计算了数据帧中值为 "./." 的行数，并将其存储在名为 "miss1" 的变量中。

def phased_geno_ACC(randLst1, randLst2): from tqdm import tqdm rand1 = pd.read_csv(randLst1,header=None) rand2 = pd.read_csv(randLst2,header=None) ori_geno1 = pd.read_csv("randLst1.original_gt.txt", header=None) miss1 = ori_geno1[ori_geno1[0] =="./."].shape[0] ori_geno2 = pd.read_csv("randLst2.original_gt.txt", header=None) miss2 = ori_geno2[ori_geno2[0] =="./."].shape[0] phased_geno1 = open("randLst1.phase.gt.txt", "w") phased_geno2 = open("randLst2.phase.gt.txt", "w") ACCfile = open("imputed_ACC.result.txt", "w") total_1 = imputedVcf.shape[0] - miss1 total_2 = imputedVcf.shape[0] - miss2 right1 = 0 right2 = 0 for row in tqdm(range(imputedVcf.shape[0])): print(imputedVcf.iloc[row, rand1.iloc[row, 0]], file = phased_geno1) print(imputedVcf.iloc[row, rand2.iloc[row, 0]], file = phased_geno2) if ori_geno1.iloc[row, 0] == imputedVcf.iloc[row, rand1.iloc[row,0]].replace("|", "/"): right1 += 1 if ori_geno2.iloc[row, 0] == imputedVcf.iloc[row, rand2.iloc[row,0]].replace("|", "/"): right2 += 1 ACC1 = right1 / total_1 ACC2 = right2 / total_2 print(f"regarding missing site as wrongness, the total masked site is {total_1} and {total_2}\n ACC1 site is {right1} and ACC2 site is {right2}\nimputed genotype ACC1 is {ACC1} and ACC2 is {ACC2}", file=ACCfile) phased_geno_ACC("randLst1.txt", "randLst2.txt")

这是一个关于 Python 编程的问题，我可以回答。这段代码是一个函数，名为 phased_geno_ACC，它接受两个文件名作为参数，这两个文件包含随机数列表。函数会读取这些文件，并使用随机数从另一个文件中读取数据。然后，函数会将读取到的数据写入两个文件中，并计算准确率。最后，函数会将结果写入一个文件中。

ori_df = pd.read_excel(in_file) refer_df = pd.read_excel(in_file, sheet_name=1) filtered_df = refer_df.join(ori_df.set_index(ori_df.columns[0]), on=refer_df.columns[0], how='inner')

这是一段 Python 代码，它的作用是什么？这段代码首先通过 Pandas 库读取一个 Excel 文件，并将其存储到一个名为 ori_df 的变量中。然后，它使用同样的方法读取同一文件的第二个工作表，并将其存储到一个名为 refer_df 的变量中。接下来，代码通过 join() 函数将 refer_df 和 ori_df 进行连接，连接的方式是将 refer_df 的第一列与 ori_df 的第一列进行匹配，并返回匹配后的结果。具体来说，ori_df.set_index(ori_df.columns[0]) 的作用是将 ori_df 的第一列设置为索引列，然后 on=refer_df.columns[0] 指定了用 refer_df 的第一列进行匹配。最后，how='inner' 表示只保留匹配后的结果，即两个表格中都存在的行。结果被存储在 filtered_df 变量中。

阅读全文

注释 ori_geno1 = pd.read_csv("randLst1.original_gt.txt", header=None) miss1 = ori_geno1[ori_geno1[0] =="./."].shape[0]

ori_df = pd.read_excel(in_file) refer_df = pd.read_excel(in_file, sheet_name=1) filtered_df = refer_df.join(ori_df.set_index(ori_df.columns[0]), on=refer_df.columns[0], how='inner')

相关推荐

Adams方向函数详解：从ORI_ALIGN_AXIS到ORI_PLANE_MIRROR

英国大学MATLAB遗传算法程序包-gatbx-origin.zip

JavaScript实现SHA-1安全散列算法详解

def filter_data(in_file): try: ori_df = pd.read_excel(in_file) refer_df = pd.read_excel(in_file, sheet_name=1) filtered_df = refer_df.join(ori_df.set_index(ori_df.columns[0]), on=refer_df.columns[0], how='inner') return filtered_df except: print('Please check the input file!') return None

修改代码，获取“绩效监测”表：ori_excel = openpyxl.load_workbook(ori_excel_path,data_only=True)#读取数据源表格 ori_sheet = ori_excel.active#获取第一个sheet

大家在看

AGV硬件设计概述.pptx

千方百剂服务器及客户端安装白皮书

QT+QCustomPlot+QCustomPlot绘图工具之数据与图例的选中，曲线的显示与隐藏，放大被框选数据等操作

ETL Automation 使用手册 2.6

GNSS-R反演土壤水分研究分析

最新推荐

博途1200恒压供水程序，恒压供水，一拖三，PID控制，3台循环泵，软启动工作，带超压，缺水保护，西门子1200+KTP1000触摸屏

海康无插件摄像头WEB开发包(20200616-20201102163221)

PCNM空间分析新手必读：R语言实现从入门到精通

生成一个自动打怪的脚本

CarMarker-Animation: 地图标记动画及转向库

5G核心网元性能瓶颈揭秘

stm32连接红外传感器并将gsm900a短信收发实现报警

C语言时代码的实现与解析

5G SA核心网元性能问题分析

数据集yorkurban怎么跑