import sys import os f1 = open(sys.argv[1],'r') f2 = open(sys.argv[2],'r') fout = open(sys.argv[3],'w') dic1 = {} for line1 in f1: tmp1 = line1.strip().split("\t") Gene_ID = tmp1[0] anno = tmp1[1:] dic1[Gene_ID] = anno dic2 = {} for line2 in f2: tmp2 = line2.strip().split("\t") Gene_ID = tmp2[0] gene_name = tmp2[1] dic2[Gene_ID] = gene_name for key in dic2: if key in dic1: fout.write(key + "\t" + gene_name + "\t" + anno + "\n") else: fout.write(key + "\t" + gene_name + "\t" + "NA" + "\n" ) f1.close() f2.close() fout.close()

时间: 2024-04-28 17:25:29 浏览: 83

这是一段 Python 代码，它的作用是将两个文件中的数据进行合并，并输出到一个新的文件中。其中，sys.argv[1]、sys.argv[2] 和 sys.argv[3] 是命令行参数，分别代表输入文件1的路径、输入文件2的路径和输出文件的路径。代码中，首先打开输入文件1和输入文件2，并将它们的数据存储到字典 dic1 和字典 dic2 中。然后，对于字典 dic2 中的每一个键，如果它也存在于字典 dic1 中，就将它们的值（即注释信息和基因名）一起输出到输出文件中；如果它不存在于字典 dic1 中，则将其基因名和 "NA" 输出到输出文件中。最后，关闭所有文件句柄。

import sys import os f1 = open(sys.argv[1],'r') f2 = open(sys.argv[2],'r') fout = open(sys.argv[3],'w') dic1 = {} for line1 in f1: tmp1 = line1.strip().split("\t") Gene_ID = tmp1[0] anno = tmp1[1:] dic1[Gene_ID] = anno dic2 = {} for line2 in f2: tmp2 = line2.strip().split("\t") Gene_ID = tmp2[0] gene_name = tmp2[1] dic2[Gene_ID] = gene_name for key in dic2: if key in dic1: fout.write(key + "\t" + dic2[key] + "\t" + dic1[key] + "\n") else: fout.write(key + "\t" + dic2[key] + "\t" + "NA" + "\n" ) f1.close() f2.close() fout.close()，这段代码报错信息为：Traceback (most recent call last): File "/public/work/Personal/wuxu/3_blast/ninanjie/pipei.sh", line 22, in <module> fout.write(key + "\t" + dic2[key] + "\t" + dic1[key] + "\n") TypeError: can only concatenate str (not "list") to str，请修改上述代码

根据报错信息，我们可以看到最后一行出现了TypeError，即字符串与列表不能直接拼接。这是因为dic1的值是一个列表，而我们在拼接时没有指定具体的元素，导致报错。因此，我们需要将dic1[key]改为dic1[key][0]，即取出列表中的第一个元素进行拼接。修改后的代码如下： ``` import sys import os f1 = open(sys.argv[1],'r') f2 = open(sys.argv[2],'r') fout = open(sys.argv[3],'w') dic1 = {} for line1 in f1: tmp1 = line1.strip().split("\t") Gene_ID = tmp1[0] anno = tmp1[1:] dic1[Gene_ID] = anno dic2 = {} for line2 in f2: tmp2 = line2.strip().split("\t") Gene_ID = tmp2[0] gene_name = tmp2[1] dic2[Gene_ID] = gene_name for key in dic2: if key in dic1: fout.write(key + "\t" + dic2[key] + "\t" + dic1[key][0] + "\n") else: fout.write(key + "\t" + dic2[key] + "\t" + "NA" + "\n" ) f1.close() f2.close() fout.close() ```

import sys import os f1 = open(sys.argv[1],'r') f2 = open(sys.argv[2],'r') f3 = open(sys.argv[3],'r') fout = open(sys.argv[4],'w') dic1 = {} for line1 in f1: tmp1 = line1.strip().split() Gene_ID = tmp1[0] # anno = tmp1[1:] # dic1[Gene_ID] = anno dic2 = {} for line2 in f2: tmp2 = line2.strip().split("\t") Gene_ID = tmp2[0] gene_name = tmp2[6] dic2[Gene_ID] = gene_name dic3 = {} for line3 in f3: tmp3 = line3.strip().split("\t") new_name = tmp3[0] raw_name = tmp3[1] dic3[new_name] = raw_name for key in dic2: if key in dic1: fout.write(key + "\t" + dic2[key] + "\n") else: fout.write(key + "\t" + dic2[key] + "\t" + "NA" + "\n" ) f1.close() f2.close() fout.close()修改代码，其中f1中只有一列数据，需要根据f1文件的内容去f2文件检索找到对应的第7列信息，由于第7列每行的字符串由逗号分割，需去掉逗号并进行换行成为新的一列，再根据新的一列信息去和f3第1列匹配，最后打印出f3中与匹配结果对应的第二列信息

import sys import os f1 = open(sys.argv[1],'r') f2 = open(sys.argv[2],'r') f3 = open(sys.argv[3],'r') fout = open(sys.argv[4],'w') dic2 = {} for line2 in f2: tmp2 = line2.strip().split("\t") Gene_ID = tmp2[0] gene_info = tmp2[6].replace(",", "\n") dic2[Gene_ID] = gene_info dic3 = {} for line3 in f3: tmp3 = line3.strip().split("\t") new_name = tmp3[0] raw_name = tmp3[1] dic3[new_name] = raw_name for line1 in f1: Gene_ID = line1.strip() if Gene_ID in dic2: gene_info = dic2[Gene_ID].strip() if gene_info in dic3: fout.write(Gene_ID + "\t" + gene_info + "\t" + dic3[gene_info] + "\n") else: fout.write(Gene_ID + "\t" + gene_info + "\t" + "NA" + "\n") else: fout.write(Gene_ID + "\t" + "NA" + "\t" + "NA" + "\n") f1.close() f2.close() fout.close()

阅读全文

相关推荐

详解Python中 sys.argv[]的用法简明解释

Python sys.argv用法实例

通过实例简单了解Python sys.argv[]使用方法

BAT脚本调用Python：跨语言自动化基础知识，夯实基础

读取两个文件，文件由tab分隔，查找文件二中第一列与文件一中的行内容一致的行，输出到新的文件中，高效完成比对，设置多线程，线程数由命令行输入参数，使用sys库实现，输出完整的代码

读取两个文件，文件由tab分隔，查找文件二中第一列与文件一中的行内容一致的行，输出文件二中符合标准的行到新的文件中，高效完成比对，设置多线程，线程数由命令行输入参数，使用sys库实现，输出完整的代码

2024年南开金融保研夏令营及推免笔面试经验干货研究报告（含金融院与金发展院）-最新出炉.zip

经典塔防游戏开发-基于Cocos2dX3.X（还原《KingdomRush》，含源码+项目说明）.zip

《基于 CNN 的电力负荷预测》（毕业设计，源码，教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip

springboot项目停车场管理系统.zip

《利用 YOLOv9 和 DeepSORT 进行对象跟踪，并结合画线功能可视化被跟踪对象路径》（毕业设计，源码，教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip

幼儿早教管理系统是一种以信息技术为基础，为幼儿早教提供全面管理和服务的软件系统

俄罗斯方块-C语言实现

《基于 pygame 的飞机战争游戏》（毕业设计，源码，教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip

《基于区块链的身份识别和访问控制生态系统设计》（毕业设计，源码，教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip

《基于Pygame的五子棋游戏》（毕业设计，源码，教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip

springboot项目大学生兼职跟踪系统.zip

大家在看

应用手册 - SoftMove.pdf

Adobe_Flash_Player_ActiveX_v34_0_0_211

子程序参数传递学习总结.docx

VITA 62.0.docx

年终活动抽奖程序，随机动画变化

最新推荐

2024年南开金融保研夏令营及推免笔面试经验干货研究报告（含金融院与金发展院）-最新出炉.zip

经典塔防游戏开发-基于Cocos2dX3.X（还原《KingdomRush》，含源码+项目说明）.zip

《基于 CNN 的电力负荷预测》（毕业设计，源码，教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip

springboot项目停车场管理系统.zip

3dsmax高效建模插件Rappatools3.3发布，附教程

【R-Studio技术路径】：从RAID 5数据恢复基础到高级操作

``` 定义1个圆类，成员有：1个半径成员变量，1个构造方法给成员变量赋初值，1个求面积方法。```定义1个圆类，成员有：1个半径成员变量，1个构造方法给成员变量赋初值，1个求面积方法。

Ruby实现PointInPolygon算法：判断点是否在多边形内

【R-Studio恢复工具解析】：RAID 5恢复的功能优势与实际应用

汇编程序编写一个程序，实现在屏幕上输出helloworld。