人类基因研究:TP53与EGFR在NCBI的详细信息

需积分: 10 0 下载量 56 浏览量 更新于2024-08-13 收藏 11.5MB TXT 举报
"该文件是关于人类基因的NCBI(美国国立生物技术信息中心)列表,其中包含了具体的基因信息,如基因ID、当前ID、状态、符号、别名、描述、染色体位置、基因组核苷酸访问版本、起始和结束位置以及基因的定向。此外,还提供了外显子数量和OMIM(在线孟德尔人类遗传学)关联信息。文件数据涉及了两种人类基因,分别是TP53和EGFR,这两种基因在癌症研究中具有重要意义。" 详细知识点解释: 1. NCBI Gene: NCBI(美国国立生物技术信息中心)是一个全球性的生物信息学资源库,其中包含大量基因和蛋白质的信息。在这个列表中,NCBI Gene提供了人类基因的详细资料。 2. Human EntrezID: Entrez是NCBI的一个搜索引擎,用于查询生物信息学数据库,包括基因、蛋白质、核酸序列等。EntrezID是每个条目的唯一标识符。 3. TP53基因:TP53基因编码肿瘤蛋白p53,这是一个重要的肿瘤抑制因子,参与细胞周期调控、DNA修复和细胞凋亡。基因突变可能导致多种癌症,如肺癌、结肠癌和卵巢癌。 4. EGFR基因:EGFR(表皮生长因子受体)基因编码一个酪氨酸激酶受体,参与细胞增殖、生存和分化。EGFR在许多类型的癌症中过度表达或发生突变,成为癌症治疗的重要靶点。 5. Status: 基因的状态可以是"live",表示这些基因信息是最新的,并且还在NCBI数据库中有效。 6. Symbol和Aliases: 这些是基因的正式名称和别名,例如TP53有多个别名,如BCC7、BMFS5等,这有助于识别和引用特定基因。 7. Map Location: 描述基因在染色体上的位置,如TP53位于17号染色体的17p13.1区域,而EGFR位于7号染色体的7p11.2区域。 8. Genomic Nucleotide Accession Version: 这是基因组核苷酸序列的版本号,如NC_000017.11,反映了基因组序列的更新情况。 9. Start and End Position: 提供了基因在染色体上开始和结束的位置,对于理解基因结构和功能至关重要。 10. Orientation: 基因的定向(正向或反向),决定其转录的方向。 11. Exon Count: 外显子是基因编码蛋白质的部分,外显子计数显示了基因的结构复杂性。 12. OMIM: 在线孟德尔人类遗传学是一个包含人类遗传疾病的数据库,OMIM关联表明这些基因与特定的遗传疾病有关。 这个文件是生物学和医学研究的重要资源,提供详尽的人类基因信息,对于理解基因功能、基因与疾病的关系以及开发潜在的治疗策略具有重大价值。

select distinct a.EMPI_ID, a.PATIENT_NO, a.MR_NO, a.PAT_NAME, a.PAT_SEX, a.PAT_AGE, a.PAT_PHONE_NO, b.DIAG_RESULT, a.ADMIT_DATE, a.DISCHARGE_DEPT_NAME, a.ATTEND_DR from BASIC_INFORMATION a join PA_DIAG b on a.MZZY_SERIES_NO=b.MZZY_SERIES_NO join EXAM_DESC_RESULT_CODE c on a.MZZY_SERIES_NO=c.MZZY_SERIES_NO join DRUG_INFO d on a.MZZY_SERIES_NO=d.MZZY_SERIES_NO join EMR_CONTENT e on a.MZZY_SERIES_NO=e.MZZY_SERIES_NO JOIN TEST_INFO A17 ON a.MZZY_SERIES_NO = A17.MZZY_SERIES_NO where a.PAT_AGE>='18' and (to_char(a.ADMIT_DATE,'YYYY-MM-DD') >= '2021-01-01') AND (b.DIAG_RESULT LIKE '%鼻咽癌%' or b.DIAG_RESULT LIKE '%鼻咽恶性肿瘤%' or b.DIAG_CODE LIKE '%C11/900%') and d.DRUG_NAME not in (select DRUG_NAME FROM DRUG_INFO WHERE DRUG_NAME like '卡培他滨') and b.DIAG_RESULT NOT IN (SELECT DIAG_RESULT FROM PA_DIAG WHERE DIAG_RESULT LIKE '%HIV阳性%') and b.DIAG_RESULT NOT IN (SELECT DIAG_RESULT FROM PA_DIAG WHERE DIAG_RESULT LIKE '%充血性心力衰竭%') AND to_char(( A17.TEST_DETAIL_ITEM_NAME = '中性粒细胞' AND A17.TEST_RESULT >= 1.5 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '血小板' AND A17.TEST_RESULT >= 100 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '血红蛋白' AND A17.TEST_RESULT >= 9 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '丙氨酸氨基转移酶' AND A17.TEST_RESULT <= 2.5 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '天门冬氨酸氨基转移酶' AND A17.TEST_RESULT <= 2.5 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '肌酐清除率' AND A17.TEST_RESULT > 51 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '肌酐' AND A17.TEST_RESULT <=1.5 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '凝血酶原时间' AND A17.TEST_RESULT <= 1.5 ))语句哪里有问题

2023-06-07 上传

优化代码 def fault_classification_wrapper(vin, main_path, data_path, log_path, done_path): start_time = time.time() isc_path = os.path.join(done_path, vin, 'isc_cal_result', f'{vin}_report.xlsx') if not os.path.exists(isc_path): print('No isc detection input!') else: isc_input = isc_produce_alarm(isc_path, vin) ica_path = os.path.join(done_path, vin, 'ica_cal_result', f'ica_detection_alarm_{vin}.csv') if not os.path.exists(ica_path): print('No ica detection input!') else: ica_input = ica_produce_alarm(ica_path) soh_path = os.path.join(done_path, vin, 'SOH_cal_result', f'{vin}_sohAno.csv') if not os.path.exists(soh_path): print('No soh detection input!') else: soh_input = soh_produce_alarm(soh_path, vin) alarm_df = pd.concat([isc_input, ica_input, soh_input]) alarm_df.reset_index(drop=True, inplace=True) alarm_df['alarm_cell'] = alarm_df['alarm_cell'].apply(lambda _: str(_)) print(vin) module = AutoAnalysisMain(alarm_df, main_path, data_path, done_path) module.analysis_process() flags = os.O_WRONLY | os.O_CREAT modes = stat.S_IWUSR | stat.S_IRUSR with os.fdopen(os.open(os.path.join(log_path, 'log.txt'), flags, modes), 'w') as txt_file: for k, v in module.output.items(): txt_file.write(k + ':' + str(v)) txt_file.write('\n') for x, y in module.output_sub.items(): txt_file.write(x + ':' + str(y)) txt_file.write('\n\n') fc_result_path = os.path.join(done_path, vin, 'fc_result') if not os.path.exists(fc_result_path): os.makedirs(fc_result_path) pd.DataFrame(module.output).to_csv( os.path.join(fc_result_path, 'main_structure.csv')) df2 = pd.DataFrame() for subs in module.output_sub.keys(): sub_s = pd.Series(module.output_sub[subs]) df2 = df2.append(sub_s, ignore_index=True) df2.to_csv(os.path.join(fc_result_path, 'sub_structure.csv')) end_time = time.time() print("time cost of fault classification:", float(end_time - start_time) * 1000.0, "ms") return

2023-05-28 上传