上述代码输出格式为{'SMILES': nan}，{'SMILES': nan}......怎样才能输出格式为{nan,nan,nan}

如果想要得到`{'SMILES': nan}`这样的键值对形式而不是单个元素的字典，你需要稍作调整。因为`to_dict(orient='records')`会返回一个包含整个DataFrame每一行的列表，而你想要的是一个字典，其键对应列名，值是所有行对应的值。这可以通过`to_dict(orient='index')`或者手动创建字典来实现。这里是一个修改后的示例： ```python def excel_to_dict_nans(file_path): data = pd.read_excel(file_path) # 使用索引作为键，值为Series，其中缺失值表示NaN data_dict = data.apply(lambda x: {col: np.nan if pd.isna(x[col]) else x[col] for col in x.index}, axis=1).to_dict() return data_dict data_dict_nans = excel_to_dict_nans('input_smiles.xlsx') print(data_dict_nans) ``` 这个版本的`excel_to_dict_nans`函数会创建一个字典，其中键是列名，值如果是`np.nan`（表示缺失），则对应键的值就是`nan`。

decomp =[Recap.RecapDecompose(mol)for mol in mol_list] smiles = [] for dec in decomp:#'rdkit.Chem.Recap.RecapHierarchyNode'>值类型 smi =dec.GetAllChildren() smile =smi.keys() smiles.append(smile) results = [] for fragment in smiles: results.append([fragment]) df_results = pd.DataFrame(results,columns=['fragment']) with pd.ExcelWriter('D:\HBVdata\hbvrecap.xlsx') as writer: df_results.to_excel(writer, index=False)这段代码改进

根据您提供的代码，我可以提出以下改进建议： 1. 将代码分成多个函数，以提高可读性和可维护性。 2. 使用列表推导式简化代码，并使用enumerate函数记录迭代次数。 3. 使用with语句管理文件句柄，以确保文件在使用完毕后能够正确关闭。 4. 使用os.path.join函数代替硬编码路径，以提高代码的可移植性。下面是改进后的代码示例： ``` import pandas as pd import os from rdkit import Chem from rdkit.Chem import Recap def get_smiles(mol): decomp = Recap.RecapDecompose(mol) smiles = [] for dec in decomp: smi = dec.GetAllChildren() smile = smi.keys() smiles.append(smile) return smiles def process_mols(mol_list): results = [] for i, mol in enumerate(mol_list): fragments = get_smiles(mol) for fragment in fragments: results.append([i, fragment]) return pd.DataFrame(results, columns=['index', 'fragment']) def save_results(df, filepath): with pd.ExcelWriter(filepath) as writer: df.to_excel(writer, index=False) if __name__ == '__main__': mol_list = [Chem.MolFromSmiles('CCO'), Chem.MolFromSmiles('CCN')] df_results = process_mols(mol_list) filepath = os.path.join('D:', 'HBVdata', 'hbvrecap.xlsx') save_results(df_results, filepath) ``` 上述代码中，首先定义了一个名为get_smiles的函数，用于获取给定分子的SMILES字符串。然后，定义了一个名为process_mols的函数，用于处理给定分子列表，并将结果返回为一个DataFrame对象。最后，定义了一个名为save_results的函数，用于将DataFrame对象保存为Excel文件。在__main__函数中，我们定义了一个mol_list列表，包含两个简单的分子，然后调用process_mols函数来处理这些分子。最后，我们调用save_results函数将结果保存到指定的Excel文件中。

# 转换SMILES为分子指纹 smiles = data['SMILES'] fps = [] for smi in smiles: mol = Chem.MolFromSmiles(smi) fp = rdFingerprintGenerator.GetCountFPs([mol])[0] fps.append(fp.ToBitString())

你可以使用RDKit库来将SMILES转换为分子指纹。以下是一个示例代码： ```python from rdkit import Chem from rdkit.Chem import rdFingerprintGenerator smiles = data['SMILES'] fps = [] for smi in smiles: mol = Chem.MolFromSmiles(smi) fp = rdFingerprintGenerator.GetCountFPs([mol])[0] fps.append(fp.ToBitString()) ``` 在这个代码中，你首先从RDKit库中导入所需的模块，然后创建一个空的列表`fps`来存储分子指纹。接下来，你遍历每个SMILES字符串，使用`Chem.MolFromSmiles()`函数将其转换为RDKit的分子对象。然后，使用`rdFingerprintGenerator.GetCountFPs()`函数计算分子的指纹，并将其添加到`fps`列表中。最后，你可以使用`fp.ToBitString()`将指纹转换为字符串形式并存储在`fps`列表中。请注意，这只是一个示例代码，你可能需要根据自己的需求进行适当的修改。

阅读全文

上述代码输出格式为{'SMILES': nan}，{'SMILES': nan}......怎样才能输出格式为{nan,nan,nan}

# 转换SMILES为分子指纹 smiles = data['SMILES'] fps = [] for smi in smiles: mol = Chem.MolFromSmiles(smi) fp = rdFingerprintGenerator.GetCountFPs([mol])[0] fps.append(fp.ToBitString())

相关推荐

SMILES：使用pyparsing的简单SMILES验证器和解析器-.zip

小分子SMILES药物设计数据集.zip

基于smiles的神经网络预测分子性质.

sourcejs-smiles:Smiles 支持 SourceJS 的中间件

SMILES：使用pyparsing的简单SMILES验证器和解析器

monitor-smiles:监控器微笑

Space-Smiles:该存储库包含为 NASA Space Apps Challenge 2015 开发的网站和应用程序

Image2Smiles:给定一个分子的图像，会产生微笑或摩尔表达

以下代码报错'UIntSparseIntVect' object has no attribute 'ToBitString'，是为什么呢？ smiles = data['SMILES'] fps = [] for smi in smiles: mol = Chem.MolFromSmiles(smi) fp = rdFingerprintGenerator.GetCountFPs([mol])[0] fps.append(fp.ToBitString())

导出的结果如上，怎样把SMILES：删除

from rdkit import Chem mols = df[‘SMILES’].apply(Chem.MolFromSmiles)用上述代码将smiles格式转为mol格式，接着保存为什么格式的文件能方便被padel软件处理，给出代码

导出的结果如上，怎样把数据前面的SMILES：删除

【java毕业设计】智慧社区在线教育平台（源代码+论文+PPT模板）.zip

最新推荐

【java毕业设计】智慧社区在线教育平台（源代码+论文+PPT模板）.zip

基于深度强化学习的德州扑克AI算法优化详细文档+全部资料+源码.zip

JavaScript实现的高效pomodoro时钟教程

管理建模和仿真的文件

【WebLogic客户端兼容性提升秘籍】：一站式解决方案与实战案例

使用jupyter读取文件“近5年考试人数.csv”，绘制近5年高考及考研人数发展趋势图，数据如下（单位：万人）。

CMake 3.25.3版本发布：程序员必备构建工具

"互动学习：行动中的多样性与论文攻读经历"

数字信号处理全攻略：掌握15个关键技巧，提升你的处理效率

给定不超过6的正整数A，考虑从A开始的连续4个数字。请输出所有由它们组成的无重复数字的3位数。编写一个C语言程序