# Add a one hot encoding of drugs to the drug features one_hot = pd.DataFrame(np.eye(len(drug_fps)), columns=["hot_" + str(i) for i in range(len(drug_fps))], dtype=int).set_index(drug_fps.index) drug_feat = pd.concat((drug_fps, one_hot), axis=1) return drug_feat, rec_id_to_idx_dict解释一下

时间: 2023-06-17 07:05:34 浏览: 48
这段代码的功能是将药物特征向量(drug_fps)转换为药物特征矩阵(drug_feat),并且在药物特征矩阵中添加了药物的 one-hot 编码。 首先,使用 np.eye() 函数创建一个单位矩阵,该矩阵的大小为药物特征向量的长度。然后,将每个单位矩阵的行作为一个药物的 one-hot 编码,将这些编码作为列添加到一个新的 DataFrame 中。这个 DataFrame 的索引与原始药物特征向量的索引相同。 接下来,使用 set_index() 函数将新的 DataFrame 的索引设置为原始药物特征向量的索引,以便将原始药物特征向量和新的 one-hot 编码矩阵按行连接起来。最后,使用 concat() 函数将原始药物特征向量和新的 one-hot 编码矩阵按列连接起来,得到一个新的药物特征矩阵(drug_feat)。 返回的 drug_feat 是一个 DataFrame,其中每行代表一个药物,每列代表一个药物特征或 one-hot 编码,rec_id_to_idx_dict 是一个字典,用于将药物 ID 映射到其在 drug_feat 矩阵中的行索引。
相关问题

帮我解读下这个代码:import csv import os import numpy as np import pandas as pd import pymysql from pymysql import connect # %% # drug_table = pd.read_excel('./data/drug.xlsx') drug_table_an = pd.read_excel('./data/mimiciv_feature_info.xlsx', sheet_name='antibiotic') drug_table_sa = pd.read_excel('./data/mimiciv_feature_info.xlsx', sheet_name='sedatives_and_analgesics') drug_table_co = pd.read_excel('./data/mimiciv_feature_info.xlsx', sheet_name='anticoagulant') prescriptions = pd.read_csv('/data/check_in/EHR_data/MIMIC_III/CSV/PRESCRIPTIONS.csv') item = pd.read_csv('/data/check_in/EHR_data/MIMIC_III/CSV/D_ITEMS.csv') labitem = pd.read_csv('/data/check_in/EHR_data/MIMIC_III/CSV/D_LABITEMS.csv') columns_pre = prescriptions.columns.tolist() columns_item = item.columns.tolist() columns_labitem = labitem.columns.tolist() # drugs = (drug_table['anticoagulant'].to_list()+drug_table['antiplatelet'].to_list())[:-4] drugs = ['barbital' ,'zepam' ,'zolam' ,'zolpidem' ,'propofol' ,'dexmedetomidine' ,'pentobarbital' ,'clonazepam' ,'alprazolam' ,'estazolam' ,'Zolpidem Tartrate'] drug_test_tsv = open('drug_patients_sedative.csv', 'w', newline='', encoding='utf-8') drug_test = csv.writer(drug_test_tsv, delimiter=',') drug_test.writerow(columns_pre) item_test_tsv = open('item_patients_sedative.csv', 'w', newline='', encoding='utf-8') item_test = csv.writer(item_test_tsv, delimiter=',') item_test.writerow(columns_item) labitem_test_tsv = open('labitem_patients_sedative.csv', 'w', newline='', encoding='utf-8') labitem_test = csv.writer(labitem_test_tsv, delimiter=',') labitem_test.writerow(columns_labitem) # import pdb;pdb.set_trace() for drug in drugs: # print(type(drug)) sql = "select * FROM PRESCRIPTIONS where drug like '%"+ drug + "%' or drug_name_poe like '%"+ drug + "%' or drug_name_generic like '%"+ drug + "%'" print(sql) conn = connect(host='127.0.0.1', port=3306, user='root', passwd='root', db='mimiciii') cursor = conn.cursor() cursor.execute(sql) data_tmp = cursor.fetchall() # print(data_tmp is None) if len(data_tmp) != 0: for data_cur in data_tmp: print(data_cur[1], data_cur[2], data_cur[3], data_cur[7], data_cur[8], data_cur[9]) drug_test.writerow(list(data_cur)) # import pdb;pdb.set_trace() for drug in drugs: # print(type(drug)) sql = "select * FROM D_ITEMS where label like '%{}%'" .format(drug) print(sql) conn1 = connect(host='127.0.0.1', port=3306, user='root', passwd='root', db='mimiciii') cursor1 = conn1.cursor() cursor1.execute(sql) data_tmp = cursor1.fetchall() if len(data_tmp) != 0: for data_cur in data_tmp: print(data_cur[1], data_cur[2]) item_test.writerow(list(data_cur)) # import pdb;pdb.set_trace() for drug in drugs: # print(type(drug)) sql = "select * FROM D_LABITEMS where label like '%{}%'" .format(drug) print(sql) conn1 = connect(host='127.0.0.1', port=3306, user='root', passwd='root', db='mimiciii') cursor1 = conn1.cursor() cursor1.execute(sql) data_tmp = cursor1.fetchall() if len(data_tmp) != 0: for data_cur in data_tmp: print(data_cur[1], data_cur[2]) labitem_test.writerow(list(data_cur)) # import pdb;pdb.set_trace() # %% import pandas as pd drug = pd.read_csv('drug_patients_sedative.csv') print(drug.DRUG.unique()) # %% print(drug.DRUG_NAME_POE.unique()) # %% print(drug.DRUG_NAME_GENERIC.unique()) # %%

这段代码是Python语言的导入模块语句,它导入了csv、os、numpy、pandas和pymysql等模块,并从pymysql模块中导入connect函数。这些模块提供了各种功能,如读写CSV文件、操作操作系统、进行数值计算、处理数据和连接MySQL数据库等。

drugs_to_search = [ {"drug_name": "Viagra"}, {"input_smiles": "C[C@@H]1C[C@H]2[C@@H]3CCC4=CC(=O)C=C[C@]4(C)[C@@]3(F)C@@HC[C@]2(C)[C@@]1(O)C(=O)CO"}, {"pubchem_cid": "5362132"}, {"drug_name": "bla"}] mapped_drugs = rsv.map_drugs(pd.DataFrame(drugs_to_search))解释一下

这段代码的作用是将一个包含不同药品信息的列表 `drugs_to_search` 映射成一个 Pandas DataFrame 格式的数据,然后再将映射后的数据输入到名为 `rsv.map_drugs()` 的函数中进行处理。 具体来说,`drugs_to_search` 列表中包含了四个元素,每个元素都是一个字典类型,分别表示了不同的药品信息。其中,第一个元素的键为 `"drug_name"`,表示药品的名称;第二个元素的键为 `"input_smiles"`,表示药品的 SMILES 表示法;第三个元素的键为 `"pubchem_cid"`,表示药品的 PubChem ID;第四个元素的键同样为 `"drug_name"`,表示另一个药品的名称。 `pd.DataFrame(drugs_to_search)` 表示将 `drugs_to_search` 列表转换成一个 Pandas DataFrame 格式的数据,其中每个元素的键将成为 DataFrame 的列名,而每个元素的值将成为 DataFrame 的一行数据。转换后的 DataFrame 数据将作为参数传递给 `rsv.map_drugs()` 函数进行处理。

相关推荐

{% extends "admin/base.html" %} {% block content %} 药品列表 ID 药品名称 操作 {% for drug in drugs %} {{ drug.id }} {{ drug.drug_name }} 编辑 <form action="{% url 'admin:drug_db_drug_list_delete' drug.id %}" method="post" class="d-inline"> {% csrf_token %} <button class="btn btn-danger btn-sm">删除</button> </form> {% empty %} 暂无药品 {% endfor %} 添加新药品 药品相互作用 ID 药品1 药品2 相互作用 操作 {% for interaction in interactions %} {{ interaction.id }} {{ interaction.drug1 }} {{ interaction.drug2 }} {{ interaction.interaction }} 编辑 <form action="{% url 'admin:drug_db_drug_interaction_delete' interaction.id %}" method="post" class="d-inline"> {% csrf_token %} <button class="btn btn-danger btn-sm">删除</button> </form> {% empty %} 暂无药品相互作用 {% endfor %} 添加新药品相互作用 {% endblock %} 为上述代码设置相应的视图和URL配置,并将这些视图和操作注册到Django admin页面中。

Consider the following information about the pharmacies, patients and drugs: ● (1) Patients are identified by an SSN, and their names, addresses, and ages must be recorded. ● (2) Doctors are identified by an SSN. For each doctor, the name, specialty, and years of experience must be recorded. ● (3) Each pharmaceutical company (制药公司) is identified by name and has a phone number. ● (4) For each drug, the trade name and formula(成份)must be recorded. Each drug is produced by a given pharmaceutical company, and the trade name identifies a drug uniquely from among the products of that company. ● (5) Each pharmacy(药房) has a name, address, and phone number. Each pharmacy is identified by ID. ●(6) Every patient has a primary doctor. Every doctor has at least one patient. ● (7) Each pharmacy sells several drugs and has a price for each. A drug could be sold at several pharmacies, and the price could vary from one pharmacy to another. ● (8) Doctors prescribe drugs for patients. A doctor could prescribe one or more drugs for several patients, and a patient could obtain prescriptions from several doctors. Each prescription has a date and a quantity associated with it. ●(9) Pharmaceutical companies have long term contracts with pharmacies. A pharmaceutical company can contract with several pharmacies, and a pharmacy can contract with several pharmaceutical companies. For each contract, you have to store a start date, an end date. 用ER图进行描述用python代码表示

最新推荐

recommend-type

2022-2028全球与中国甲硝唑市场现状及未来发展趋势.doc

全球甲硝唑主要厂商有CordenPharma Farchemia、同济药业、Aarti Drugs和Manav Drugs等。 目前中国是全球最大的甲硝唑市场,占有大约90%的市场份额,之后是印度和欧洲市场,二者共占有超过10%的份额。 本报告研究全球...
recommend-type

智慧物流医药物流落地解决方案qytp.pptx

智慧物流医药物流落地解决方案qytp.pptx
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

解释minorization-maximization (MM) algorithm,并给出matlab代码编写的例子

Minorization-maximization (MM) algorithm是一种常用的优化算法,用于求解非凸问题或含有约束的优化问题。该算法的基本思想是通过构造一个凸下界函数来逼近原问题,然后通过求解凸下界函数的最优解来逼近原问题的最优解。具体步骤如下: 1. 初始化参数 $\theta_0$,设 $k=0$; 2. 构造一个凸下界函数 $Q(\theta|\theta_k)$,使其满足 $Q(\theta_k|\theta_k)=f(\theta_k)$; 3. 求解 $Q(\theta|\theta_k)$ 的最优值 $\theta_{k+1}=\arg\min_\theta Q(
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。
recommend-type

"互动学习:行动中的多样性与论文攻读经历"

多样性她- 事实上SCI NCES你的时间表ECOLEDO C Tora SC和NCESPOUR l’Ingén学习互动,互动学习以行动为中心的强化学习学会互动,互动学习,以行动为中心的强化学习计算机科学博士论文于2021年9月28日在Villeneuve d'Asq公开支持马修·瑟林评审团主席法布里斯·勒菲弗尔阿维尼翁大学教授论文指导奥利维尔·皮耶昆谷歌研究教授:智囊团论文联合主任菲利普·普雷教授,大学。里尔/CRISTAL/因里亚报告员奥利维耶·西格德索邦大学报告员卢多维奇·德诺耶教授,Facebook /索邦大学审查员越南圣迈IMT Atlantic高级讲师邀请弗洛里安·斯特鲁布博士,Deepmind对于那些及时看到自己错误的人...3谢谢你首先,我要感谢我的两位博士生导师Olivier和Philippe。奥利维尔,"站在巨人的肩膀上"这句话对你来说完全有意义了。从科学上讲,你知道在这篇论文的(许多)错误中,你是我可以依
recommend-type

实现实时监控告警系统:Kafka与Grafana整合

![实现实时监控告警系统:Kafka与Grafana整合](https://imgconvert.csdnimg.cn/aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X2pwZy9BVldpY3ladXVDbEZpY1pLWmw2bUVaWXFUcEdLT1VDdkxRSmQxZXB5R1lxaWNlUjA2c0hFek5Qc3FyRktudFF1VDMxQVl3QTRXV2lhSWFRMEFRc0I1cW1ZOGcvNjQw?x-oss-process=image/format,png) # 1.1 Kafka集群架构 Kafka集群由多个称为代理的服务器组成,这
recommend-type

帮我实现在Androidstudio调用chapgpt并提供源码

首先,你需要运行一个ChitGPT的服务器,然后通过Android应用程序与该服务器进行通信。以下是一个简单的Android应用程序示例,可以与ChitGPT进行通信: 1. 首先,在Android Studio中创建一个新的项目,并添加以下依赖项: ``` implementation 'com.squareup.okhttp3:okhttp:4.9.0' implementation 'com.google.code.gson:gson:2.8.6' ``` 2. 创建一个新的Java类,用于与ChitGPT服务器通信。以下是一个简单的实现: ```java import com.