没有合适的资源?快使用搜索试试~ 我知道了~
软件X 17(2022)100969原始软件出版物GraSPI:有机电子学中基于图形的形态学定量的可扩展软件Devyani Jivania,Jaroslaw Zolab,Baskar Ganapathysubramanianc,Olga Wodoa,a材料设计与创新,布法罗大学,布法罗,纽约,美国b计算机科学与工程,布法罗大学,布法罗,纽约,美国c美国爱荷华州立大学机械工程系ar t i cl e i nf o文章历史记录:收到2021年收到修订版,2021年10月18日接受,2021年保留字:图论材料信息学微结构描述符a b st ra ct我们描述GraSPI-可扩展的基于图形的软件实现为C/C++包。GraSPI计算了一个大的描述符相关的有机电子给定一个分段的2D或3D微结构。该软件包将微结构表示为等效图,并利用图论算法有效地计算这些描述符。它还包括一套用于在各种格式之间转换数据并对图形分析的原始结果进行后处理的工具。在这里,我们提供了说明性的例子,GraSPI版权所有2021作者。由爱思唯尔公司出版这是CC BY-NC-ND下的开放获取文章许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。代码元数据当前代码版本v1.0用于此代码版本的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-21-00061法律代码许可证BSD许可证使用git的代码版本控制系统使用C++、python、bash的软件代码语言、工具和服务编译要求、操作环境Boost库开发人员文档/手册https://owodolab.github.io/graspi/问题支持电子邮件olgawodo@buffalo.edu1. 动机和意义本文所描述的软件包GraSPI的目的是为微观结构数据分析提供了一个有效的、可扩展的工具。这种工具可以简化材料科学家从微观结构数据集中提取物理学信息特征的能力。这样一套特征的可用性可以极大地简化和民主化映射和探索结构-性质(SP)关系的虽然包装的设计是通用的例如,我们的主要应用焦点是有机电子器件的活性层形态。许多新兴领域,包括可穿戴电子[1],多路复用传感器[2]和生物电子[3],将从对这些潜在SP关系的更好理解中受益。*通讯作者。电子邮件地址:olgawodo@buffalo.edu(Olga Wodo).https://doi.org/10.1016/j.softx.2021.100969像我们这样的可扩展软件框架是及时的,因为正在为有机电子建立更多有机电子工业现在有潜力以低廉的成本自动表征和成像大量的样品[5,6],通过组合探索加工条件。收集这些数据的能力远远超过了目前理解和推理这些数据的能力[7]。因此,软件工具能够快速,高效,自动提取物理意义的功能,从每个图像可以铺平道路,识别有意义的过程-结构-属性(PSP)的识别PSP地图很少是一项微不足道的任务,由于所观察到的微观结构信息之间的固有失配(例如,通过显微镜或模拟)和显著更少的(即,有限的)自由度。毕竟,尽管显微结构成像的目标是提供详细的,高分辨率的地图,2352-7110/©2021作者。由爱思唯尔公司出版。这是一篇开放获取的文章,使用CC BY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表SoftwareX期刊主页:www.elsevier.com/locate/softxDevyani Jivani,Jaroslaw Zola,Baskar Ganapathysubramanian et al.软件X 17(2022)1009692∑k−1是w(e(v,v))。我 i+1∈=∈∈∈·==•∈=·=0⊆⊆·=→+·=:√在高维数据集上,建立定量SP链接的目标是获得一小部分特征,这些特征可以解释材料属性中的最大变异性。使这一困境进一步复杂化的是,所需的一组特征可能无法直接测量,甚至无法先验地知道。GraSPI从微观结构计算一组特征1可以用于后续的数据分析和机器学习,特别是在有机电子领域。对于输入,该软件包使用具有两个或多个阶段的分段显微图来计算一组全面捕获大小,形状和拓扑结构描述符的特征。GraSPI专注于有机光致发光材料(OPV)的微观结构量化[8,9],其现代版本OPV薄膜的形貌直接影响电池内的物理过程,从而影响电子器件的性能。因此,为了量化,理解和优化OPV形态和性能之间的关系,我们专注于编码扩散,传输和界面特性的微观结构特征几个研究小组已经使用这些特征在OPV中建立SP图[10,10-在其当前形式中,GraSPI处理两相形态的量化,尽管所有数据结构都可概括为处理多相形态[18]。此外,我们通过使数据结构与维度无关以及能够处理结构化(即,晶格)和非结构化(即,点云)数据。这种能力在相关工作中特别有用[19,20],其中来自分子动力学模拟和量子化学计算的数据被耦合以使用相同的基于图形的形态表示来建立跨多个尺度的SP关系。2. 软件描述GraSPI建立在基于图形的微观结构表示的概念上。分割的、数字化的形态被表示为标记的、加权的、无向图。3D中的每个它的相位,所有顶点都与编码距离信息的边相连。简单的两相和三相形态的图形构造如图所示。1.一、一旦将形态表示为图,则使用来自图论的标准算法在下面的段落中,我们首先介绍了一些图的定义和它们的特点,其次是从数字化形态学的图构造的形式化2.1. 基本定义一个带标签的加权无向图G((V, L),(E, W))是一个带标签的加权无向图(V,(E, W)),它有一个相关的标签函数L,L为V中的每个顶点分配一个标签。在这项工作中,我们用颜色标记每个顶点• 源顶点s∈V和目标顶点t∈V之间的路径是一个序列p= [v0,v1,. . .五岛. . vk]使得vo=s,vk=t,并且对于从0到i−1的每个i,顶点vi和vi+1在G中相邻. 路径p的长度我0源顶点sV和目标顶点tV之间的最短路径是G中s和t之间的所有路径中长度最短的s和t之间的路径。G中顶点s和t之间的距离是G中s和t之间的最短路径的长度。如果不存在这样的路径,该距离被定义为无穷大。请注意,一对顶点之间的最短路径不需要是唯一的,但它们之间的距离是唯一的。图G的一个子图是图G′(V′,E′)使得V′V的E。点集V′V上的一个点导出子图是顶点集为V′的极大子图。一个图G是连通的,如果任意一对图之间存在一条路的顶点数。G的连通分支C是G的极大连通子图。GraSPI有三个构建块:图构造、最短路径和连通性计算,以及用于定制定义目标描述符的图查询的图过滤几个扩散,锡永,界面和传输描述符被改写为查询构造图。包中定义的所有描述符都依赖于这些构建块。2.2. 图构建分割的形态是软件的输入。在不失一般性的情况下,一个标记的加权无向图可以构建两相二维形态学的G((V,L),(E,W)),其对应于图1中的顶行。顶点vV对应于单个像素或体素在形态学上。每一顶点vV被赋予标签L(v),取决于相应像素的相位的“黑色”顶点通过一组边E连接。形态的固有结构(例如,均匀网格上的像素位置)用于构造边缘集合E。对于数字化形态中的每个像素,建立局部邻域;例如,一个像素在2D中可以有八个邻居,因此对应于一个像素的顶点在图形中可以有多达八个邻居。一对顶点之间的边对应于相邻像素的位置。 每个边缘e(u,v)E被分配权重W(e),权重W(e)等于形态中对应于u和v的像素之间的欧几里得距离。一个晶格距离的一阶邻居的边权重为1,而二阶邻居的边权重为2。对于3D系统,也包括三阶邻居。一个无向图G(V, E)由一组顶点V和一组边E定义,其中E中的每条边是从V中抽取的一对无序顶点。一个加权无向图G(V,(E, W))是一个无向图(V, E),其权函数W∈R赋予E中的每条边一个非负的实权.1 我们互换使用特征和描述符来表示相同的东西。特征通常用于机器学习领域,而描述符更常用于材料科学文献。图G可以为几种类型的数据构造。图图构造针对三种类型的数据,分别具有结构化两相形态、结构化三相形态和非结构化两相形态。为了处理各种类型的数据,GraSPI提供了两种输入构建图表所需数据的选项。第一个选项允许读取结构化形态,并且可以在输入形态的相位在结构化网格上离散化时使用。在这种情况下,通过边定义邻域,同时创建顶点并将其添加到图中第二个选择是非结构化数据。在这种情况下,根据输入文件从输入文件中读取数据描述的内部格式 阑尾该选项允许处理·Devyani Jivani,Jaroslaw Zola,Baskar Ganapathysubramanian et al.软件X 17(2022)1009693∈=∈Fig. 1. 三种形态的图形构造:结构化两相形态(第一行),结构化三相形态(第二行),和非结构化两相形态(第三行)。阶段0表示具有数字化形态的输入。在阶段1中,每个单位元件(例如,像素或原子)表示为图中的顶点,并分配相应的颜色。局部邻域用于通过边连接顶点。在阶段2中,将元顶点添加到表示特征元素或地标的图中-在我们的情况下,阳极和阴极,阳极顶点连接到所有顶部顶点通过附加边连接,阴极顶点连接到所有底部顶点。在阶段3中,在过滤的图上进行图查询,而阶段4涉及根据直方图的描述符的后处理。(For为了解释该图图例中对颜色的引用,读者可以参考这篇文章的WEB版本邻域特定于位置并且需要在外部确定的非结构化数据集(例如,使用Voronoi图或k-最近邻)。人们可以进一步扩展封装的功能,以考虑为三元和四元共混物制造的多相材料系统,因为这些是高性能器件的有希望的候选者[21,22]。在当前的包设计中,扩展需要相应地扩展顶点标签集和元顶点集。它还要求相应地重新定义相应的图形在第二阶段,在图3中的第三列中描绘。1,更多的元顶点被添加到图中。对于OPV形态学,添加两种类型的元顶点。第一种类型便于提取关于电极的信息:阳极和阴极,分别在图中的红色和蓝色顶点上。第二种类型提取有关接口(即,绿色顶点)。对于两相形态,只有一种类型的界面存在于黑色 和白色 顶 点之 间 。 跟 踪该 接 口, 删 除 连接BLACK 和WHITE顶点的边,然后通过添加的元顶点(即,绿色顶点)。2一旦边被添加到元顶点,权重就被分配给它们。权重W的边缘在阳极(或阴极)和阳极(或阴极)之间添加1。物理上与阳极(或阴极)相邻放置的顶点vV。同时,添加权重为0.5的边来表示界面顶点与BLACK或WHITE顶点之间的连接,vV。阳极、阴极和界面顶点分别标记为“阳极”、“阴极”和“界面”。添加的顶点允许直接估计从形态学域中的任何位置到电极的图形距离,以及从域的任何点到界面的任何距离。一旦构建了图,其量化就变得与原始维度无关(即,2D或3D)和类型(即,结构化或非结构化)。形态学的量化被重铸为图查询(即, 阶段3在Fig. ( 1),其中2 三相形态中的界面存储有两个Meta顶点:深绿色和浅绿色。它们提取了黑色和灰色相位以及白色和灰色相位之间的联系。Devyani Jivani,Jaroslaw Zola,Baskar Ganapathysubramanian et al.软件X 17(2022)100969上市44clasedge_same_color_predicate{public:edge_same_color_predicate():G_(0),color_(0){}edge_same_color_predicate(constgt::graph_tG,conststd::vectorCOLOR>color):G_(G),color_(color){}booloperator()(constgt::edge_te)const{return((*color_)[boost::source(e,*G_)]==(*color_)[boost::target(e,*G_)]);}请注意:cnstgt::graph_t*G_;consttd::vectorCOLOR>*color_;};依赖于来自图论的构造(例如,所有对最短路径、连通分量(CC)以及广度优先和深度优先搜索)。2.3. 图的三种基本运算对于目标应用程序,可以使用两种基于图的算法将特征化设置为图查询操作:查找CC和计算最短路径。这些算法在第2.3.1节和第2.3.2节中定义,用于构造特定于应用程序的查询。我们提供了示例背后的直觉,并解释了执行的细节。在这样做的时候,我们特别注意图过滤操作,它使查询定义能够捕获底层物理的某些方面。2.3.1. 图的连通分支我们首先阐明了量化单个域的数量和图查询之间的联系。在这里,我们的目标识别被其他颜色的子域包围的形态子域。我们通过为每个顶点分配CC的索引来实现这一目的(图2)。这个过程需要两个步骤。 首先,我们通过屏蔽连接不同标签或颜色的顶点的边来定义过滤图。换句话说,我们确保只考虑连接相同标签的顶点的边。在第二步中,我们在过滤后的图上调用CC算法将该流程转换为代码只需要几行代码,请参见清单1。我们使用 boost 库 中 首 先 , 代 码 定 义 谓 词 , 以 通 过 类edge_same_color_predicate来促进图过滤。 的类有一个运算符operator(),它检查给定的边是否满足过滤条件,如果满足条件,则返回true或false这样的话我们检查形成边e的两个顶点(源和目标)的颜色是否相同的条件。为了检索构成边的顶点的标签,类另外存储指向图G_的指针和顶点的标签的向量(例如,color_)。一旦定义了图形过滤,它就用于过滤原始图确定图表中CC的函数包含在清单2中。它由三行组成:上面定义的类型的对象p的声明,filtered_graphde类型的过滤图FG在boost::graph库中进行了细化,并从boost库中调用了决定连接的函数connected_components过滤图中的连接组件。该过程的结果被存储在具有与CC的索引相对应的整数值的向量分量图图2示出了标记了CC的索引的简单示例。在图中,图中的每个顶点具有表示其所属的CC的所有顶点,包括元顶点,已经被分配了索引。在确定CC的情况下,可以进行详细的量化。例如,一个简单的操作是查询CC总数的图形。在我们的示例中,CC的总数是七个,其中三个CC是黑色的(即,指数1-3),两个为白色(即,索引4和5),以及两个对应于两个电极(即,指数0和6)。在下一轮图查询中,我们执行旨在确定与底部边界相邻的CC的附加操作。我们首先找到蓝色元顶点的所有最近邻居,然后在该邻域中创建相应的CC索引在这种情况下,集合包括一个CC索引:索引1。该CC是黑色的,并且没有白色CC与蓝色顶点直接相邻。我们对红色元顶点重复查询,并了解到CC的集合由两个索引组成:索引3和4。具有索引3的CC是黑色,而具有索引4的CC是白色。对于我们的目标应用,如果连接到阳极(即,红色元顶点)和白色CC(如果连接到阴极)(即,BLUE元顶点)。在该形态中,仅一个CC被认为是有用:CC with Index 4.图查询的逐渐演变将查询转换为物理上有意义的描述符。2.3.2. 图中的最短路径最短路径的计算是有用的,以估计的性质有关的带电和不带电的物种内的BHJ特别地,这样的计算可以用于估计激子在它们朝向供体-受体界面扩散时的路径长度,带有正电荷和负电荷),因为它们穿过曲折域到达特定电极。对于这些计算,首先确定从元顶点到其他感兴趣顶点的最短路径,然后进行后处理以确定路径长度的直方图。定义一个类的示例代码,过滤原始图的方法如清单3所示。谓词允许过滤连接RED顶点到所有黑色顶点以及黑色到黑色顶点。有几种方法可以定义过滤边的条件。我们的实现包括检查三个条件。对于由源顶点和目标顶点定义的每条边,我们检查两种颜色组合:红色和黑色以及黑色和RED. 3一旦定义了过滤图的谓词,我们就在确定图中最短路径的函数中使用它。清单4中包含了该函数的代码,它首先声明谓词和相应的过滤图。接下来我们3该函数还保留连接相同颜色顶点的所有边。谓词确保我们保留连接WHITE和WHITE顶点的边。在计算最短路径时会忽略这些边,因为连接白色和黑色顶点的边会被忽略。Devyani Jivani,Jaroslaw Zola,Baskar Ganapathysubramanian et al.软件X 17(2022)100969上市55voidDetermineCo nectedComponnts(gt::graph_t*G,conststd::vectorCOLOR>color,std::vectorcomponnts){edge_same_color_predicatep(*G,color);boost::filtered_grapgt::graph_t,edge_same_color_predicate>FG(*G,p);boost::connected_compons(FG,componts[0]);}清单3clased ge_color_BLACK_or_RED_prdicate{public:edge_color_BLACK_or_RED_predicate():G_(0),color_(0){}edge_color_BLACK_or_RED_predicate(constgt::graph_tG,conststd::vectorCOLOR>color):G_(G),color_(color){}booloperator()(constgt::edge_te)const{if(*c〇l〇r_)[b 〇st::s〇urce(e,*G_)]==RED)&&((*color_)[boost::target(e,*G_)]==BLACK))returntruee;if(*color_)[boost::target(e,*G_)]==RED)&&((*color_)[boost::source(e,*G_)]==BLACK))returntruee;return((*color_)[boost::source(e,*G_)]==(*color_)[boost::target(e,*G_)]);}请注意:cnstgt::graph_t*G_;consttd::vectorCOLOR>*color_;};定义两个向量来存储最短路径计算的结果:p和d。向量d存储所有单源最短路径的长度,而向量p存储沿着最短路径的父节点的索引。这两个向量都被初始化以用于代码片段的最后一行,Dijkstra算法的执行在这里,我们确定从RED顶点到过滤图中所有顶点作为结果,对于每个顶点,我们可以查找到RED元顶点的距离,并通过使用向量p跟踪所有父顶点的生成来重建最短路径。代码的结构与第2.3.1节中的代码相似。 它不仅涉及通过谓词进行图过滤和执行图算法,而且还具有选择的通用功能单源最短路径问题中的源。在GraSPI中,该函数用于多个顶点-例如,查找从绿色顶点到所有黑色顶点的最短路径,以及从蓝色顶点到所有白色顶点的最短路径。我们现在解释如何对图查询 图 3,我们描绘了三种形态以及从所有黑色像素到最短路径的直方图到接口。这些形态的选择是由于特征尺寸和到界面的距离的显著变化。在第二行中,我们描绘了来自图查询的所有最短路径的长度的直方图。该直方图提供了对不同长度的路径数量的洞察。从直方图中,可以很容易地提取出与界面距离非常短的域的分数的信息。在第一形态的情况下,10%的黑色顶点在距界面0.5像素的距离内。其他形态分别占18.5%和20%。在我们的OPV应用中,所描述的查询被翻译为量化距离界面d内的供体(BLACK)的分数。该信息可以从累积直方图(图3,第三行)中更无缝地显示出来,图二. 一个简单的图的例子,其中标记了连通分量的索引。黑色组件的数量(即,三个)和白色分量(即,两个),连 接 到 顶 部 的黑色组件的 数 量 (一个),连接到底部的 白 色 组 件 (即,无)。Devyani Jivani,Jaroslaw Zola,Baskar Ganapathysubramanian et al.软件X 17(2022)1009696=清单4vidFistanceToVertxN(gt::graph_t*G,conststd::vectorCOLOR>color,gt::vertex_tn){edge_color_BLACK_or_RED_prdicateprd(*G,color);boost::filterd_graphgt::graph_t,edge_color_BLACK_or_RED_prdicate>FG(*G,prd);std::vectordo ble>d(boost::num_vertices(*G));std::vectorgt::vertex_t>p(boost::num_vertices(*G));std::fill(d.begin(),d.end(),0.0);for(unsignedinti=0;in;++i)p[i]=i;boost::dijksta_shortt_paths(FG,top_electrode,boost::pdecessor_map(&p[0]). distance_map(d[0]));}图三. 从三个示例形态提取的各种类型的信息(顶部)。所描绘的直方图提供关于从表示供体材料(黑色)的任何顶点到界面的距离的形态的详细表征。我们绘制直方图来说明概率质量函数P(距离=x)(第二行)和累积概率质量函数P(距离x)(最后一行)。<有助于物理上有意义地理解离界面10 nm距离内的电子供体材料的总分数(P(距离x))。在分析的形态中,第三形态的该分数最高(100%),第一形态的该分数最低(82%)。我们还可以改变距离d,并从直方图中提取该距离内的像素的分数(即,概率质量函数)的路径长度(即,距离)。该方法是对直方图进行后处理以提取捕获目标应用程序的某些方面的物理上有意义的描述符的示例。2.4. 软件构架GraSPI是一个命令行工具,其设置可在命令行中配置。有关可用功能的详细信息,请参见第2.5节。GraSPI是用C/C++编写的,使用boost库进行基于图形的操作[25]。GraSPI接受结构化和非结构化数据的两种输入格式(有关这些格式的详细信息,请参阅附录)和一组用于输出的文本文件。集合将描述符输出到标准流并且可以在多于一个命令的序列中使用(即,在管道中)。例如,可以将GraSPI的标准输出重定向到日志文件。GraSPI由一组工具补充,包括将plt格式转换为行优先格式的格式转换器输入数据的格式和可以用于生成距离直方图并生成所有描述符的单页摘要:格式转换器:从plt格式到输入数据的行为主格式;后处理工具,可用于:生成距离的直方图,并生成所有描述符的一页摘要。2.5. 软件功能要了解GraSPI用法消息提供了可以使用的参数列表:./格拉什皮GraSPI接受两种格式的输入数据:图形和数组。有关更多信息,请查看文档./ graspi-g INPUT_FILE.graphe>./ graspi-a INPUT_FILE.txt>(行优先顺序)-s(default 1)-p <0,1>(default 0-false )-n <2,3>( default 2-D,A)-r pathwhere store results(default./)··Devyani Jivani,Jaroslaw Zola,Baskar Ganapathysubramanian et al.软件X 17(2022)1009697===表1描述符列表以及与图形算法的关系,OPV性能测量以及光伏过程的三个步骤:光吸收(ABS),激子解离(DISS)和电荷传输(CT)。当与OPV性能没有直接关系时,则将描述符标记为统计(STAT)。命名与GraSPI输出的日志文件一致第三列列出了与图形算法的关系CC=连通分量算法,DA=Dijkstra算法,GF =图滤波。描述符与图形的关系与OPV性能的关系ABS_wf_D黑顶点的加权分数V的基数光吸收STAT_CC_D黑色CC数量:CC–STAT_CC_A白色CC数量CC–STAT_CC_D_An黑色CC连接到红色CC的数量CC + GFSTAT_CC_A_Ca白色CC连接到蓝色的数量CC+GFSTAT_n顶点数V的基数STAT_n_D黑色顶点数GF+V的STAT_n_A白色顶点数GF+V的ABS_f_D黑色顶点分数GF+V的光吸收CT_f_conn有用顶点的比例-无岛:CC+GF电荷传输CT_f_conn_D_An黑色顶点连接到红色顶点的比例CC+GF电荷传输CT_f_conn_A_Ca白色顶点连接到蓝色的比例CC+GF电荷传输DISS_wf10_D距离为10的黑色顶点到绿色的加权分数GF+DA激子扩散DISS_f10_D距离绿色10的黑色顶点比例GF+DA激子扩散STAT_e绿色一阶边数E的基数激子扩散CT_e_conn有补路的整数边数公司简介–CT_f_e_conn具有蓝色和红色互补路径的接口比例公司简介电荷传输CT_e_D_An路径为RED的BLACKint顶点数公司简介–CT_e_A_Ca路径为BLUE的WHITEint顶点数公司简介–CT_f_D_tort1具有直线上升路径的黑色顶点的比例(t=1)GF+DA电荷传输CT_f_A_tort1具有直线上升路径的白色顶点的比例(t=1)GF+DA电荷传输CT_n_D_adj_An与红色顶点直接接触的黑色顶点数GF+DA电荷传输CT_n_A_adj_Ca与蓝色顶点直接接触的白色顶点数GF+DA电荷传输GraSPI需要一个强制输入参数:输入文件的名称和相应的参数(-a或-g和).其余参数是可选的,如果没有显式提供参数,则具有默认值。-a INPUT_FILE.txt>(行优先顺序)是输入有关结构化数据的信息利用该方法,可以在构建图形时确定每个体素或像素的邻域-g INPUT_FILE.graphe>是输入非结构化数据信息的选项。输入文件必须提供关于图的所有信息,这意味着图中每个顶点的邻域需要在外部确定奈利。元顶点和相关的边需要在输入文件中定义。使用此选项时,GraSPI读取文本文件并从输入文件中读取顶点和边集,这些顶点和边集需要与包中针对给定用例定义-s< pixelSize>(默认值为1)是设置像素大小的选项,用于计算最短路径的长度。如果未指定,则所有结果将根据像素数量,需要重新缩放以进行维度分析。-p 0,1>(默认值为0,表示假)是指定是否在侧面上应用周期性其仅对作为阵列选项输入的形态有效(即,-a)。-n 2,3>(默认值2,即,黑色和白色,电子供体和电子接受材料)是用于指定相数的选项。对于三相形态(选项-n 3),读取黑色、白色和灰色顶点,分别对应于电子供体、电子受体和混合相材料-rpath是指定结果存储位置的选项(默认值。/)-也就是说,将保存带有结果的文本文件的位置。标准输出,而数组描述符指向相应的文件。标量描述符及其图形关系的列表总结在表1中。数组描述符对应于最短距离,并保存在文件DistancesGreenToRedViaBlack.txt、DistancesGreen-ToBlueViaWhite.txt、DistancesBlackToRed.txt、DistancesWhiteTo-Blue.txt、DistancesBlackToGreen.txt、TortuosityBlackToRed.txt和TortuosityWhiteToBlue.txt中。文件名指示用于过滤图表的条件。例如,文件Distances- BlackToGreen.txt存储任何供体、黑色和0体素与绿色界面之间的所有最短距离。 如果源顶点和目标顶点之间没有直接连接,则距离设置为无穷大。这是如何提高库正在初始化距离向量。距离被保存按照来自输入文件的标签的顺序,并且保持无限距离,以便保持将距离映射回输入体素的能力。3. 通过图形查询进行形态学注释的示例在本节中,我们以一页摘要(图4)的形式呈现了一个具有描述符集的示例形态学注释,该摘要是使用GraSPI和bash生成的,bash 是 一 种 用 于 处 理 文 本 的 命 令 行 工 具 ( 例 如 , grep 和sed);gnuplot,它允许快速可视化;和乳胶,它允许结合各种数据源这些脚本包含在包含示例的文件夹摘要中的左列包括具有形态,22标量描述符计算GraSPI,和三个额外的描述符后处理的距离数组。摘要中的右列描绘了六个距离直方图对于一种类型的途径,A-途径至Ca(即,受体通道朝向阴极),显示三种类型的信息:通道长度的直方图、通道的弯曲度,以及通道平衡(即,供体和受体途径之间)。GraSPI计算两种类型的描述符:标量描述符,tors和数组描述符。 标量描述符指向4输出std::cout.Devyani Jivani,Jaroslaw Zola,Baskar Ganapathysubramanian et al.软件X 17(2022)1009698见图4。G r a S P I 生 成 的描述符和直方图的一页摘要示例。图五. GraSPI的运行时间为2D和3D形态与越来越大的图形方面的顶点和边的数量。对于2D和3D形态,运行时间以秒为单位。在台式计算机上,分析的最大形态包括250万个顶点,或1300万条边和顶点 配备2.3 GHz双核英特尔酷睿i5处理器和8 GB RAM。4. 计算复杂度到目前为止讨论的完整框架是在C++中使用基于图的操作的boost库实现的[25]。我们进行了一组实验来证明与描述符计算相关的计算成本。图5报告描述符计算中涉及的所有操作的总运行时间(以秒为单位)报告的运行时间包括数据读取、图形过滤、CC的确定薄膜的代表性形态包括在图2的第二列和第三列中。五、 为了逐渐增加形态的尺寸,基本形态被逐渐复制:在2D中垂直地复制,在3D中水平地复制5对于2D分析,考虑了不同域尺寸和几何形状的三种形态。我们选择这些结构来测试不同类型的形态在一系列CC和最短距离下的性能。绘制的数量为图2 中第二列中最顶部的形态。 五、6和最短距离,以及描述符的计算(见表1)。测试是在两种类型的数据上执行的,数据的大小不断增加。我们使用了2D和3D周期性结构,这些结构是使用薄膜几何形状的Cahn-Hillard方程生成的5 基本形态是周期性的,这意味着复制确保了形态的连续性。6 我们还水平地复制了形态(这里没有报道),没有发现任何显著差异。Devyani Jivani,Jaroslaw Zola,Baskar Ganapathysubramanian et al.软件X 17(2022)1009699++O O+图A.6. 结 构 化相位信息的 简 单 例 子 和两种 格式:数组和图基。探索的最小2D或3D样本为100×7 400[19]第十九话我们预计,GraSPI可以为以下方面做出贡献:一个显微照片,对应于总共140,000个顶点。的各种研究领域,包括生物材料和陶瓷,每次测试的样本量均加倍,最大样本量显示2D中约有256万个顶点,1.6在3D中,这相当于总共约1200万个顶点和边的组合。由于RAM限制,问题大小的上限是有限的对于顶点数超过300万的样本,在所用机器上达到了最大RAM(8 GB)限制图5,我们绘制了评估这两种形态所需的时间。我们将2D和3D结构的数据绘制为问题大小的函数(即,到边和顶点的总数)分别使用黑色和灰色线和点。对于2D,运行时间从最小样本的2秒增加到最大样本的32秒此外,具有类似于2D结构的图形的大小的3D结构的运行时间是可比较的。对于所检查的形态尺寸的范围,观察到运行时间接近线性。这与复杂性理论一致,该理论认为Dijkstra基于图的算法的计算复杂度顶点和边的数量)。对每个样本量重复分析5次,数值在平均运行时间值的2%范围内(此处未显示)。总之,我们的分析表明,在问题范围内(即,高达1200万个(V E),250万个2D顶点,1000万个(VE)对应于160万个顶点在3D中),总执行时间小于1分钟,这创造了运行实时分析和高通量探索的机会此外,执行时间对维度不敏感(即,2D与3D)。这种质量对于使用基于图的算法来评估3D结构是有价值的,因为复杂性仅取决于图的大小5. 影响GraSPI已经在推进目前对OPV PSP地图的理解方面发挥了重要作用。此外,它可以用来民主化的能力,非计算机精通领域的科学家,快速和几乎实时提取一套广泛的微观结构描述符。GraSPI先前已用于构建OPV性能的替代模型[11]和OPV的微观结构优化[17,27],以及创建用于分析的数据库[10我们已经应用这种方法来量化两相和三相形态,并扩展了它将点云数据用于分子动力学模拟分析[20]。我们还将其扩展为多尺度方法7 为了在3D中匹配该尺寸,我们采用厚度为第三维中的1个体素分子和连续体尺度的。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作致谢这项工作得到了美国国家科学基金会(1906344和1906194,部分由OAC-1845840)的支持。BG网络-来自ONR,美国MURI计划的边缘支持。OW支持美国布法罗大学阑尾 两种输入格式GraSPI接受结构化和非结构化数据的两种输入格式结构化数据假设每个维度中离散点的大小是已知的。维数在输入文件的第一行中提供为nx, ny, nz。输入文件的提醒包含数组(即,对应矩阵的行式表示)与来自可用标签集合的对应相位一旦数据被结构化,就可以在GraSPI读取数据时构建局部邻域。在第二种格式中,对应于非结构化数据,关于相位的信息需要与邻域一起提供。在这里,我们使用邻接矩阵来通知GraSPI关于邻域的信息。输入文件从数据集中的顶点总数开始。接下来,每一行都提供了关于每个漩涡的信息:顶点的索引,然后是顶点的颜色。行的其余部分由包含邻居信息的三元组组成。每个三元组由邻居的索引、与邻居的距离和邻居的类型组成。在我们的示例中,考虑了三种类型的邻居:一阶、二阶和三阶邻居,分别标为所述类型集合可以重新定义以编码附加信息(见图1)。A.6)。引用[1]西玛MJ。下一代可穿戴电子产品。Nature Biotechnol2014;32(7):642-3.[2]何晓萍,胡晓丽,詹姆斯TD,尹J,田H. 多路复用光致发光传感器:改进疾病诊断。Chem Soc Rev2017;46(22):6687-96。[3]Malliaras GG.有 机生 物电 子学 : 有机 电子 学 的新 纪元 。 Biochim BiophysActa2013;1830(9):4286-7.[4]Peng Z,Jiang K,Qin Y,Li M,Balar N,O'Connor BT,et al.的形态 , 机 械 和 光 伏 性 能 的 三 元 有 机 光 伏 共 混 物 的 最 佳 操 作 。 Adv EnergyMater2021;11(8):2003506.Devyani Jivani,Jaroslaw Zola,Baskar Ganapathysubramanian et al.软件X 17(2022)10096910[5] Spurgeon SR,Ofus C,Jones L,Petford-Long A,Kalinin SV,Olszta MJ,etal. Towards data-driven next-generation transmission electron microscopy.Nature Mater2020;1-6.[6] de Pablo JJ,Jackson NE,Webb MA,Chen L-Q,Moore JE,Morgan D,et材 料 基因组倡议的新领域。Npj Comput Mater2019;5(1):1-23.[7] 加纳帕蒂苏布拉马尼安·沃多蒸发薄膜是如何演变的?聚合物共混物溶剂基制造过程中相分离机理的
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- GO婚礼设计创业计划:技术驱动的婚庆服务
- 微信行业发展现状及未来发展趋势分析
- 信息技术在教育中的融合与应用策略
- 微信小程序设计规范:友好、清晰的用户体验指南
- 联鼎医疗:三级甲等医院全面容灾备份方案设计
- 构建数据指标体系:电商、社区、金融APP案例分析
- 信息技术:六年级学生制作多媒体配乐古诗教程
- 六年级学生PowerPoint音乐动画实战:制作配乐古诗演示
- 信息技术教学设计:特点与策略
- Word中制作课程表:信息技术教学设计
- Word教学:制作课程表,掌握表格基础知识
- 信息技术教研活动年度总结与成果
- 香格里拉旅游网设计解读:机遇与挑战并存
- 助理电子商务师模拟试题:设计与技术详解
- 计算机网络技术专业教学资源库建设与深圳IT产业结合
- 微信小程序开发:网络与媒体API详解
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功