从 full database.xml文件中提取approved药物的id、name、type和<experimental-properties>/<calculated-properties>中的Molecular Weight及另一个数值property。将以上信息读入一个DataFrame中，保存为property.csv文件。统计不同type药物的Molecular Weight和另一个数值property的平均值（降序排列）。对不同type药物的Molecular Weight，绘制并显示箱型图

好的，我明白了。以下是我给出的解决方案：首先，我们需要安装并导入所需的库和模块，包括`xml.etree.ElementTree`、`pandas`和`matplotlib`： ```python import xml.etree.ElementTree as ET import pandas as pd import matplotlib.pyplot as plt ``` 然后，我们可以使用`ElementTree`模块读取XML文件，并提取所需的信息。具体来说，我们需要找到每个approved药物的id、name和type，以及其对应的Molecular Weight和另一个数值property。这些信息存储在XML文件的不同节点中，因此我们需要使用XPath表达式逐个查找这些节点。具体来说，我们可以使用以下代码： ```python # 读取XML文件 tree = ET.parse('full database.xml') root = tree.getroot() # 初始化数据 data = {'id': [], 'name': [], 'type': [], 'Molecular Weight': [], 'property': []} # 查找每个approved药物的信息 for drug in root.findall(".//drug[./groups/group/text()='approved']"): # 查找id、name和type drug_id = drug.find('./drugbank-id[@primary="true"]').text name = drug.find('./name').text type = drug.find('./classification/description').text # 查找Molecular Weight和property mol_weight = None property = None for prop in drug.findall('.//property'): if prop.find('./kind').text == 'Molecular Weight': mol_weight = float(prop.find('./value').text) elif property is None: property = float(prop.find('./value').text) # 将结果添加到数据中 if mol_weight is not None and property is not None: data['id'].append(drug_id) data['name'].append(name) data['type'].append(type) data['Molecular Weight'].append(mol_weight) data['property'].append(property) ``` 接下来，我们可以使用`pandas`库将数据转换为DataFrame，并将其保存到CSV文件中： ```python # 将数据转换为DataFrame df = pd.DataFrame(data) # 保存为CSV文件 df.to_csv('property.csv', index=False) ``` 然后，我们可以对不同类型的药物进行分组，并计算它们的Molecular Weight和另一个数值property的平均值，并按Molecular Weight平均值的降序排列。 ```python # 按type分组，并计算平均值 grouped = df.groupby('type').mean() # 按Molecular Weight平均值降序排列 grouped = grouped.sort_values('Molecular Weight', ascending=False) # 打印结果 print(grouped) ``` 最后，我们可以绘制不同类型药物的Molecular Weight的箱型图： ```python # 绘制箱型图 plt.figure(figsize=(10, 6)) df.boxplot(column=['Molecular Weight'], by='type') plt.ylabel('Molecular Weight') plt.show() ``` 完整的代码如下： ```python import xml.etree.ElementTree as ET import pandas as pd import matplotlib.pyplot as plt # 读取XML文件 tree = ET.parse('full database.xml') root = tree.getroot() # 初始化数据 data = {'id': [], 'name': [], 'type': [], 'Molecular Weight': [], 'property': []} # 查找每个approved药物的信息 for drug in root.findall(".//drug[./groups/group/text()='approved']"): # 查找id、name和type drug_id = drug.find('./drugbank-id[@primary="true"]').text name = drug.find('./name').text type = drug.find('./classification/description').text # 查找Molecular Weight和property mol_weight = None property = None for prop in drug.findall('.//property'): if prop.find('./kind').text == 'Molecular Weight': mol_weight = float(prop.find('./value').text) elif property is None: property = float(prop.find('./value').text) # 将结果添加到数据中 if mol_weight is not None and property is not None: data['id'].append(drug_id) data['name'].append(name) data['type'].append(type) data['Molecular Weight'].append(mol_weight) data['property'].append(property) # 将数据转换为DataFrame df = pd.DataFrame(data) # 保存为CSV文件 df.to_csv('property.csv', index=False) # 按type分组，并计算平均值 grouped = df.groupby('type').mean() # 按Molecular Weight平均值降序排列 grouped = grouped.sort_values('Molecular Weight', ascending=False) # 打印结果 print(grouped) # 绘制箱型图 plt.figure(figsize=(10, 6)) df.boxplot(column=['Molecular Weight'], by='type') plt.ylabel('Molecular Weight') plt.show() ``` 希望这能解决你的问题！

相关推荐

嵌入式系统/ARM技术中的虹晶科技授权获得ARM处理器

VITA62.0-2016 VPX Modular Power Supply Standard .pdf

PDM中EMS项目管理.pptx

写出 bpmn带审批驳回的流程图的xml文件

root@approved-bliss-1:~# apt-get updateapt-get install sudosudo <command> -bash: syntax error near unexpected token newline' root@approved-bliss-1:~# apt-get updateapt-get install sudosudo <command> -bash: syntax error near unexpected token newline' root@approved-bliss-1:~#

map.put("approved",judge)中judge可以是什么

C#从数据库中下载文件，需要进行审批流审批，审批通过后可以下载文件

List<Report> reportList过滤数据

我现在有三种类型的数据分别是我提交的 、我审批的、待审批的 他们分别对应着三种后端查询接口 现在我要在前端一个页面内 的三个表单中分别显示他们的分页数据 前端angular代码应该怎么写

39.107.83.187:12346/articles get 请求 获取到json格式为{ "code": 0, "data": [ { "id": 1, "title": "Qt", "content": "Qt正文", "author_id": 0, "permission_type": 1, "is_approved": true } ] }的数据展示到界面上.完整html

利用elementPlus写一个查看用户评价的页面vue

dpkg: 错误: 无法新建文件 '/var/lib/dpkg/info/format-new': 没有那个文件或目录 E: 子进程 dpkg --set-selections 返回了一个错误号 (2) E: Couldn't record the approved state changes as dpkg selection states

Permission can only be set at AndroidManifest.xml.

asp.net中后端如何对通过和不通过两种按钮在同一个函数里进行赋值

PHP语句读取数据表，把数据表中status为pending的数据在PHP前端用灰色表示，status为approved的数据在PHP前端用绿色表示

教室借用系统代码HTML

最新推荐

1719378276792.jpg

GO婚礼设计创业计划：技术驱动的婚庆服务

管理建模和仿真的文件

【基础】PostgreSQL的安装和配置步骤

字节跳动面试题java

微信行业发展现状及未来发展趋势分析

"互动学习：行动中的多样性与论文攻读经历"

【基础】安装MySQL：从下载到配置的完整指南

# 请根据注释在下面补充你的代码实现knn算法的过程 # ********** Begin ********** # # 对ndarray数组进行遍历

信息技术在教育中的融合与应用策略

我现在有三种类型的数据分别是我提交的、我审批的、待审批的他们分别对应着三种后端查询接口现在我要在前端一个页面内的三个表单中分别显示他们的分页数据前端angular代码应该怎么写

39.107.83.187:12346/articles get 请求获取到json格式为{ "code": 0, "data": [ { "id": 1, "title": "Qt", "content": "Qt正文", "author_id": 0, "permission_type": 1, "is_approved": true } ] }的数据展示到界面上.完整html

# 请根据注释在下面补充你的代码实现knn算法的过程 # Begin # # 对ndarray数组进行遍历