没有合适的资源?快使用搜索试试~ 我知道了~
þHOS T E D B Y可在www.sciencedirect.com网站上查阅计算设计与工程学报3(2016)337www.elsevier.com/locate/jcde钢件放大图片作者:Andres Bustilloa, n.López de Lacalleb,Asier Fernán-Valdivielsob,PedroSantosaa西班牙布尔戈斯布尔戈斯大学土木工程系b西班牙毕尔巴鄂巴斯克大学机械工程系UPV/EHU接收日期:2016年3月4日;接收日期:2016年6月16日;接受日期:2016年6月26日2016年6月30日在线发布摘要提出了一种测量冷锻钢螺纹磨损的实验方法在这项工作中,第一个目标是测量在微合金化HR45钢的攻丝孔中制造的各种类型的轧辊丝锥的磨损。不同的几何形状和磨损程度进行测试和测量。以成形丝锥的几何形状为关键因素,确定了磨损最小、性能最好的成形丝锥类型。在成形叶片上观察到磨粒磨损。腔室区域和标称直径周围的叶片数量越多,意味着载荷分布越均匀,成形过程越平缓第二个目标是确定最准确的不同的数据挖掘技术进行测试,以选择最准确的一个:从标准版本,如多层感知器,支持向量机和回归树,以最新的,如旋转森林合奏和迭代装袋合奏。最好的结果是使用旋转森林的集合,未修剪的回归树作为基本回归量,将最佳测试基线技术的RMS误差降低了33%,而使用未修剪的M5P作为基本回归量的加性回归,将线性拟合的RMS误差分别降低了25%和39%然而,在统计学上,较低的长度在加性回归中比在轮换森林中更难建模因此,以未修剪回归树作为基础回归量的轮伐林似乎是对这个工业问题建模的最合适的回归量&2016 年 CAD/CAM 工 程 师 协 会 。 出 版 社 : Elsevier 这 是 一 个 在 CC BY-NC-ND 许 可 证 下 的 开 放 获 取 文 章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:轧辊丝锥磨损;轧辊丝锥;螺纹加工;成形丝锥;组合;轮换林;回归树1. 介绍制造内螺纹有两种基本技术:成形攻丝(使用滚轧/成形丝锥)和切削攻丝(使用切削丝锥)。第一个过程是无屑的,因为螺纹是通过冷加工过程形成的。因此,实现了更强的螺纹(特别是在易受应变硬化影响的材料中)、良好的螺纹校准和更长的刀具寿命。在本工作中研究了成形攻丝,在这种情况下,应用于冷锻件,其中孔是在冷锻过程中冲压的。在成形攻丝的情况下,螺纹通过冷加工过程中原材料的变形形成[1]。n通讯作者。传真号码:34 947258910。电子邮件地址:abustillo@ubu.es(A. Bustillo)。同行评审由CAD/CAM工程师协会负责这个过程会在形成的螺纹(螺纹峰)的小直径处产生缺陷,称为爪或分裂峰,尽管这些缺陷并不意味着强度降低[2,3]。爪形取决于螺纹加工前的孔径[4]。成形攻丝可在延性钢、有色合金[5]和回火钢[6]上进行。Stéphan等人[7]通过优化初始孔径,保持了可接受的成形扭矩和足够深的螺纹,以避免剥离Fromentin等人[8]研究了成形攻丝、测量材料位移和Stéphan等人的三维塑性流动[9]使用ABAQUS 6.5软件程序开发了成形攻丝的三维有限元模型丝锥磨损的预测涉及三种磨损现象:粘着磨损、磨粒磨损和冲蚀磨损。粘着磨损是由材料从一个表面转移到另一个表面引起的。磨料磨损是由于材料从一个http://dx.doi.org/10.1016/j.jcde.2016.06.0022288-4300/2016 CAD/CAM工程师协会。&出版社:Elsevier这是一个在CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。338A. Bustillo等人/计算设计与工程学报3(2016)337固体表面,由于硬颗粒或粗糙度峰相对于另一接触表面的滑动效应。最后,侵蚀性磨损是由于含有固体颗粒的液体模拟集中于通过变形制造外螺纹[10]。Domberky[11]致力于以良好的精度模拟螺纹轧制,然后优化工艺参数[12]。最直接的方法涉及磨损表面的宏观描述和基于工艺参数的磨损经验建模[13]。数据挖掘代表了一系列计算技术,用于分析非常复杂的现象。应用于制造问题的最常见的数据挖掘技术包括人工神经网络(ANN),支持向量机(SVM),k最近邻回归机和回归树。两个或多个模型的组合,称为集合,将组合模型的预测能力相加。在许多应用中,集成模型已显示出其优越性。 例如,Yü[14]使用集成来识别多变量过程中的失控信号。Liao等人。[15]和Bustillo和Rodriguez[16]分别使用了用于砂轮和多齿刀具状态监测的集成,而Cho[17]和Bisaeid[18]使用集成进行端铣状态监测,并同时检测端铣中的瞬态和渐进异常。集成的优势在于规避了其他人工智能模型(如ANN)的微调[19]。最常见的集成技术类型是Bagging,Boosting和Random Subspaces。最后,最近的集成技术,旋转森林[20],已经证明了对不同工业问题建模的能力[21]。所有这些技术将在第3节中详细介绍。据作者所知,目前还没有其他的研究采用数据挖掘技术对攻丝过程输出进行建模。Shichang等人[22]开发了一种使用混合学习算法和工程驱动规则的机械加工过程根本原因识别的新方法。相比之下,Mazahery[23]提出使用ANN进行复合材料的摩擦学行为建模,在训练阶段调整网络中的权重和偏差,以最小化建模错误.在关系到 铝在纳米复合材料加工中,Mazahery [24]提出使用遗传算法来预测机械性能并优化工艺条件,Shabani [25]使用自适应神经模糊推理系统结合粒子群优化方法进行工艺优化。本文的新颖之处在于它的实验分析和数据挖掘模型相结合,以提取尽可能多的信息,形成攻丝过程中,在高需求的工业过程中的刀具磨损。多层感知器是文献中提到的最广泛使用的标准人工智能技术, 以确定这种新方法的基线改进[19]。本文的结构如下:在介绍的最后,第2节介绍了成形攻丝的基本原理和为获得该工业过程的真实数据而实现的实验装置;第3介绍了将用于对这些工业数据进行建模的数据挖掘技术;第4介绍并讨论了使用数据挖掘技术进行测量和建模的实验结果;最后,第5总结了主要结论从这项研究和未来的工作中获得2. 攻丝原理及实验步骤2.1. 成形攻丝丝锥几何形状是可靠工艺的最重要参数。标准丝锥特性包括倒角长度、倒角中的螺距数、丝锥直径和丝锥截面周围的凸角数。图1示出了典型成形丝锥的几何形状和特征。所有显示丝攻的图片均朝向丝攻尖端左侧。如图1所示,丝锥部分的每个圆角被称为凸角,其中变形或摩擦发生在前一个孔的内表面上。因此,抽头部分由弯曲的侧面多边形定义,通常可能有三个,五个或六个角,这些角被称为凸角。每种丝锥都有三种类型的凸角:i)位于倒角区域的增量成形凸角; ii)围绕标称直径的校准成形凸角;以及iii)通向丝锥柄的导向凸角的Fig. 1. 轧辊丝锥的术语和几何形状[13]。A. Bustillo等人/计算设计与工程学报3(2016)337339~¼¼¼新丝锥3000螺纹5000螺纹图二、新丝锥和3000和5000螺纹后的丝锥轮廓和磨损校准凸角和导向凸角的形状并没有太大的不同,因此它们之间的精确边界是丝锥磨损的函数,并且并不精确,如稍后将示出的。已经考虑了每个凸部的上表面长度(上部长度)和离隙侧上的长度(下部长度)以及每个凸部的总长度的变化。在成形丝锥中观察到两种类型的磨损:材料磨粒磨损和粘着磨损。磨粒磨损主要在材料去除过程中与材料保持接触的叶片中观察到。如果它们在成形丝锥的倒角区域中,则凸角逐渐凹入并且在可变深度处在侧面上展开,该深度与螺纹与工具接触的部分一样深在叶片位于导向区的情况下,在标称直径下,与材料的接触直到弹性恢复的时刻,并且由于螺纹在接触的时刻完全形成,因此在导杆上的区域的高度最大。粘着磨损定义如下。涂层磨损总是从叶片前部开始。最初,分层是可能的,然后,随着磨损变得更加渐进,它可能与磨料摩擦有关。钢可能沉积在叶片的前部,通过附着在涂层区域上的磨料磨损。材料沉积在叶片的前侧上,并且其延伸以在与后叶片的磨料磨损相反的方向上覆盖叶片。因此,粘附力被描述为跳动。2.2. 实验装置实验的目的是测试不同类型的轧辊丝锥具有不同的几何形状和磨损程度。攻丝条件包括在6巴的压力下外部润滑15%乳液,应用以下工艺参数:M10 1.5成形丝锥ISO尺寸,1200 mm/min进料速度,1.5 mm/rev进料速率,800rpm转速和30 m/min成形速度。丝锥具有以下特点:a)基体材料,TiN涂层高速钢,b)6GX公差。针对3种不同类型的辊式丝锥(总共18种成形丝锥)测试了6种丝锥。类型1有一个5节距倒角,具有六边形(601)几何形状,没有油槽。2型有3-具有带油槽的五边形(721)几何形状的节距倒角。类型3具有3节距倒角,具有五边形(721)几何形状,没有油槽。螺距的数量与倒角的长度成正比。倒角区域中的大量节距会导致盲孔中的问题,这些盲孔在孔的底部处具有低间隙的要求由于之前在真实车间中的工作,每个丝锥都表现出不同的磨损程度,达到1000、2000、3000、4000和5000个螺纹,与新的未磨损丝锥进行比较(图2)。磨损分析和实验结果在[13]中详细介绍,基本上使用现场显微镜和特殊夹具在同一坐标测量系统中设置工具,因为这是此类实验的常见做法。成形丝锥的螺纹长度通常在公制和直径方面比切削丝锥具有更高的公差,这是由于材料的弹性程度,这意味着工件在任何塑性成形过程后都会收缩。因此,新螺纹总是略小于成形丝锥轮廓。该操作必须一次完成,因为在第一次层压后几乎不可能手动重复成形攻丝过程,这是由于第一次操作,这在切削丝锥的情况下不是问题。因此,有必要制造轧辊丝锥,使其公差上限最接近内螺纹。因此,研究中的所有丝攻均为6GX公差,以确保公差不是可能影响结果的因素。工件材料是微合金化HR 45钢,归类于微合金化(HSLA -高强度低合金)钢组HSLA钢具有细小的铁素体-珠光体结构,并含有少量(最多0.15%)的Al、Ti、Nb和V元素。根据最终用户提供的数据,其具有以下特性:屈服强度为359 MPa,极限拉伸强度为473 MPa,最终应变为34.3%。将小的测试部件冷锻,并且使用冲头开两个孔,所述孔具有9.3mm的直径和在孔内测量的223HV的硬度。冷锻通常会导致应变硬化,因此该测量对于正确解释稍后给出的结果非常重要。测试零件是将发动机连接到车辆底盘的支柱;冷锻确保了高生产率的过程。340A. Bustillo等人/计算设计与工程学报3(2016)337测试在具有14 kW主轴的3轴CNC机床上进行。所有的测试都是在干燥和润滑条件下进行的,以便比较不同的丝锥,在两种条件下形成两个螺纹。使用冷却剂的目的是避免螺纹/丝锥接触区域过热,增加润滑,并研究工业条件下的刀具行为。否则,使用干燥条件,因为监测与丝锥损坏状态更直接相关。因此,在倒角区域的所有凸角上进行丝锥磨损测量,以建立图表的基线磨损值:在略小于标称直径的凸角上和在连续更宽的凸角上。当标称直径叶片开始失去其几何形状时,后续叶片继续工作,并且它们也记录了磨损。应该记住的是这个叶瓣没有完成的变形必须由后续叶瓣完成。简而言之,该程序包括在两种不同的条件下测量成形攻丝后的磨损,即干燥和使用钻孔润滑液,使用新丝锥和使用在实际工作条件下形成的1000、2000、3000、4000和5000个先前螺纹后的丝锥,该公司使用相同类型的刀柄和乳化液冷却剂。2.3. 数据集生成在每个实验中测量丝锥磨损后,生成了用于数据挖掘模型的3个数据集在影响磨损过程的变量中,考虑了以下因素:成形丝锥的类型、螺纹数量和丝锥的凸角。如前所述,叶片从龙头尖端的第一个开始编号。根据丝锥每个凸角的3个长度标称值的变化评价丝锥磨损:下部长度、上部长度(始终从成形凸角的最大外径开始)和总长度,如前所述(参见第2节中的图1)。表1总结了所考虑的变量及其变化范围,以及它们是作为数据挖掘模型的输入还是输出。尽管由于实验的定义,这些变量中的大多数采用有限数量的值,但数据挖掘模型将线程数和3个输出视为连续的表1用于生成数据集的变量、单位和范围变量[单位]输入/输出范围[零的个数]成形丝锥输入1、2、3(类型1、2和3)龙头叶输入1的线程输入1 000上部长度[mm](上输出0前刀面)下部长度[mm](开输出0救济方)总长度[mm]输出03个数据集的每一个的实例中,109、123和131个实例记录了输出的零值,参见表1。这些零值意味着大约30%的实验显示在丝锥的测量的凸角上没有磨损。如果数据挖掘技术评估了这个数据集,它将被编程为优先考虑零值,以提高其准确性。3. 数据挖掘技术正如在引言中所解释的,数据挖掘学科提供了从一组输入变量预测一些输出变量的值的算法。有两种类型的预测技术:回归,如果所研究的变量可以取连续值,以及分类,当输出只能在有限的值之间变化时。在我们的实验工作中,对每个输出变量进行回归分析,y. 在这种类型的公式中,模型的预测基于所谓的属性(输入变量)x的函数f。回归的一般表达式如等式所示。(1),考虑具有m个属性的情况y估计值<$fx;xAm; yA1从最先进的回归算法中选择了研究问题的最精确技术均方根误差(RMSE)用于比较回归量。该指标测量预测的类值相对于其实际值的偏差。RMSE的表达式由偏差的平方的平均值的平方根给出其中,数据集的n个实例中的每一个由xi;yi表示。vuPnyfx2变量,因为它们可以在工业条件。 其他变量,例如形成抽头和抽头叶,被认为是分类变量:RMSE¼ utt¼1t-tNð2Þ成形丝锥的类型仅取3个可能值,龙头的瓣需要25,见表1。在数据挖掘模型中只考虑了25个第一凸角,因为它们是三种成形丝锥唯一共有的凸角,尽管三种类型的轧辊丝锥具有不同数量的凸角。如前所述,直径较小的丝锥凸角在倒角直径足够宽以接合材料之前没有磨损。因此,数据集包含许多反映叶片无磨损的零从435最流行的回归技术被用于试验. 这些算法可以分为四个家族:1. 决策树回归:考虑这种类型的技术是必要的,以了解第二个家庭:集成回归。2. 包围技术[26]:对最常用的算法进行了测试,因为它们已经证明了它们在几种工业任务中的适用性[14A. Bustillo等人/计算设计与工程学报3(2016)337341<ΣΣðÞ¼ð Þ3. 基于函数的回归:使用了ANN[28]和支持向量回归(SVR)[29]。选择SVR和ANN是因为它们的流行。应该注意到ANN在建模几个工业问题方面的成功[304. 基于实例的回归方法具有与其他家族完全不同的公式,因为没有分析模型将类值表示为属性的函数或者,预测值通过实例与训练数据集中的一些其他实例的相似度来获得。在测试中使用k-最近邻回归[35]3.1. 基于决策树的回归量遵循一种称为分治的策略,基于决策树的回归器在单个属性中使用递归数据划分。每个除法都是通过最大化一个是由传统的Bagging形成的,但实际值和预测值之间的差异(称为残差)用于其他的训练过程[43]。相反,在Boosting的情况下,基本回归量是顺序训练的,每个回归量都受前一个回归量的影响[44]。权重被添加到实例中,以改变基本回归量的训练。先前回归量的误差用于重新加权实例,以便使用先前错误预测的实例来训练下一个回归量。Boosting的最终预测还考虑了每个基本回归量的准确性。回归Boosting实现的一个常见变体是AdaBoost.R2[45]。在这种情况下,使用损失函数L(i)计算在实验中使用了三种如果Den是损失函数的最大值,则线性损失Ll、平方损失Ls和指数损失Le由等式中的表达式给出。(三)、8>Llili=Den在类值之间观察到的差异[36],而几个统计程序可以用来确定最具判别力的决定。Ls i l i=Den2>:LEi1-exp.-li=Denð3Þ有两种基于决策树的回归器,这取决于它们在叶子中存储的内容。虽然线性回归模型保存在模型树的每个叶子中,但在回归树中使用一组实例的平均值,从而最小化类值的子集内变化[37]。减少错误修剪树(REPTree)[38]和M5P[36]分别被选为回归和模型树的主要代表技术两个回归变量都有两种可能的配置:修剪树和未修剪树。考虑到一个基于树的回归变量和一些类型的回归树集合,使用修剪树更方便,以避免过度拟合。然而,有某些类型的回归树集合可以从使用未修剪的树中受益[39]。回归树的集合将在下一节中描述3.2. 增强回归因子集合回归是一种预测方法,它结合了几个模型的预测:基本回归[40]。在这项工作中,使用了三种最流行的合奏类型:Bagging[41],Boosting[42]和RandomSubspaces[39]。在这三种回归技术中,使用相同的学习算法来训练每个基回归量,但从原始数据形成不同的训练集。在所有情况下,我们都使用回归树作为基本回归量。在Bagging中,训练集是使用带替换的采样(即,给定一个训练集,一个特定的实例可能不会出现在其中,或者可能出现几次)[41]。基础回归量是独立的,因为训练每个基础回归量的过程不考虑其他回归量。Bagging的一个变体叫做IteratedBagging。这种技术结合了Bagging合奏:第一个随机子空间使用的子集维数小于原始数据集来训练基本回归量。这种方法有两个目标。一方面,为了避免众所周知的维数灾难问题(当数据集具有大量属性时,许多回归器会降低其性能),另一方面,通过选择低相关的基础回归器来提高预测精度。Rotation Forest[20]是本研究中测试的最新集合。它通过将其属性分组为子集(例如,通常采用三个属性的子集)。然后使用训练集中的子样本为每个组计算主成分分析。整个数据集根据这些投影进行转换,然后可以用于训练基本回归量。在 实 验 中 使 用 了 五 种 集 成 回 归 : Bagging ,IteratedBagging,RandomSubspaces和AdditiveRegression , Bagging 和 Boosting ensemble[46] 和 RotationForest之间的混合。3.3. 人工神经网络受生物过程的启发,ANN基于大脑中神经元使用的信息传输系统[47]。在这项研究中,使用了多层感知器(MLP)[47],因为它作为一种可以近似非常复杂的函数的ANN变体[48]。该模型的结构由三层组成[49]。第一个是输入(属性),第二个是隐藏层,第三个是输出层。当量(4)显示了如何获得预测y输出隐藏的层yhide用作输出层的输入W1和W2表示隐藏层和输出层的权重矩阵342A. Bustillo等人/计算设计与工程学报3(2016)337>L1>>>:.W2Y隐藏>X.ΣC1/11/1B1和B2分别表示偏置,fnet和f输出其激活函数。与之相关的。8>最大化LLL(y /f)y输出Wx输出>1X .- 是的 ΣX.第十章Σ隐藏净1 14Lαi-α*iαj-α*jxi;xj<$-εαi-α*i yiαi-α*i这些激活功能随结构而变化。在我们的实验工作中,使用了最常见的结构,其中隐藏层的激活函数是恒等式,输出层的激活函数是αi-α*i¼01/1: αi;α*iA ½0;C]ð7Þtansig[49].3.4. 支持向量回归机该技术使用函数f(x)进行预测,其中一组参数在训练阶段计算,以最小化RMSE[50]。对于线性情况,该函数的公式(五)、从输入属性x得到的预测f(x)是通过使用项w和b获得的,其中f(x)是输入空间X中的内积。f x w; x b与wA X bA5所需的函数应该尽可能接近训练样本,但不过度拟合数据,以便定义可以推广到其他实例的公式换句话说,期望的函数显示出低预测偏差,但尽可能地稳定[50]。将这两个目标表示为优化问题,目标是f(x)对于所有训练数据与预测输出yi的偏差最多为ε,同时使w的范数最小化。因此,预测中允许有一定程度的误差,但误差受到ε的限制。在实际数据中,如果存在与总趋势有较大偏差的一些情况,则解决先前描述的优化问题可能是不可行的或导致过度拟合。因此,Boser et al.[29]重新定义了优化问题,允许在某些情况下偏差大于ε因此,在公式中增加了一个额外的项C,如等式10所示。(六)、该参数是在可测量性和大于ε的误差的偏差之间的折衷。在Eq. 公式(7)仅涉及线性情况,但使用非线性函数的推广是可能的。在SVR的一般定义中,内积不是直接在原始输入特征空间中计算的,而是使用所谓的核函数k(x,x0)。这个函数满足一组条件(称为Mercer条件)[51]。线性和径向基,在文献中最常引用的两个内核,在实验中使用。3.5. K-近邻回归量在这种数据挖掘技术中,预测的类值是先前存储的k个最相似训练实例的平均值[52]。欧氏距离是最常用的度量实例之间相似性的函数。在我们的实验工作中,使用交叉验证优化了邻居的数量。4. 结果和讨论4.1. 实验结果在本节中,介绍了磨损测量的实验结果。首先,进行目视检查,以确定丝攻是否受到任何损坏,例如圆瓣破裂或材料过度粘附。测量每个凸角边缘的下部长度和上部长度,在每种情况下从成形凸角的最大外径开始,如图3所示。图3右侧显示了用光学显微镜测量的放大的叶磨损区域。所有测量均由将丝锥定位在同一固定件上,以避免突出8>mi nimize>s:t:2jjwjj2 þiX¼1.ξiþξ*iΣð6Þ以确保足够的可重复性。在该图中,与材料接合的刃是前刃,而刃的另一长度是后刃(均为切削操作中的标准工业术语)。yi-εw;xi-εbrεiw;xii;在 Eq 中 提 出 的 优 化 问 题 。 ( 6 ) 属 于 凸 型 , 可 用Lagrange方法求解。当量(7)显示了所谓的对偶问题,即如图3所示,在旋转方向上与材料接合的刃的第一部分是前刃,前刃是刃的遭受磨损的部分。在耙的铲齿动作之后,与材料接触的卸荷铲齿经历磨损和粘附磨损,因为其边缘去除材料。图3显示了由粘附引起的典型的“沙上波浪“图案。叶片总磨损量是两个叶片长度上的磨损量¼f>A. Bustillo等人/计算设计与工程学报3(2016)337343图3.第三章。成形凸角磨损:左)丝锥旋转;右)卸荷(下)和前刀(上)齿盘磨损见图4。 “1型“成形丝锥磨损的演变。每个叶片上的磨损如图1A和1B所示。4- 6分。在这里,叶片从龙头尖端的第一个开始编号。一种假设认为,每个凸角上的磨损恶化取决于轧辊丝锥的总体磨损,因为前一个凸角上的磨损将意味着后续凸角上的更大应变,如下面清楚地解释的。所有的磨损模式对应于前刀槽上的磨损和后刀槽上的磨损和轻微粘附倒角区的界限如图所示“Type 1几乎全新的丝锥前4个叶片的磨损几乎为零然后在第10波瓣之后增加到一个恒定值.因此,得出了一个临时结论,即标称直径的第一个叶片不会受到最严重的损坏。然而,2000和5000螺纹的丝锥磨损趋势线具有非线性演变。磨损不均匀在紧密的叶中。磨损较大的叶片与材料的相互作用更多,而磨损较小的叶片可能由于丝锥的偏心而工作较少,这可能是这种随机行为的解释与前一种情况相反,“2型“轧辊丝锥的结果如图5所示,5种情况下的磨损降至零(丝攻具有1000至5000个先前螺纹),最后一级(5000个螺纹)的磨损较高,第一级(1000个螺纹)的磨损较低。磨损演变与“1型“丝锥完全不同。通过倒角区域中螺距之间的直径增加来解释差异,该直径增加大于后续螺纹的增加;达到标称直径的第一个凸角工作非常激烈。对于如图6所示,磨损随着丝锥直径的增加而增加。一旦最终螺纹直径被344A. Bustillo等人/计算设计与工程学报3(2016)337图五. “2型“成形丝锥磨损的演变。见图6。 “3型“成形丝锥磨损的演变。达到最大值后,由于与材料的接触减少,随后的叶片上的磨损减少,因为螺纹最近才形成。与材料接合的凸角经历了较小的变形,导致磨损较小(第15至第25凸角)。不同的丝锥磨损行为可归因于倒角丝锥的几何形状(“1型“成形丝锥为5节距倒角,“3型“和“2型“成形丝锥为3节距倒角)和每个截面中的凸角数量(“1型”中为六边形,“2型”和“3型”中为五边形)。“类型1“的几何形状导 致 材 料的 更 渐 进 的 变 形 , 因 此 意 味 着 更 少 的 磨 损 。在所研究的三种轧辊丝锥中,倒角凸角出现了较高的磨损当成形攻丝处于标称直径时,导向边缘与先前变形的材料接触。因此,这些边缘的磨损逐渐减少,直到达到零磨损值。为了达到零磨损水平,三个轧辊丝锥中的十个导向凸角是必要的4.2. 数据挖掘预测结果丝锥成形是一个复杂的过程,其中过程输入和输出(丝锥磨损)之间的直接关系不容易建立。这一结论已在先前的实验测试分析中概述,如果绘制输入和输出的散点图,也可以从数据挖掘的角度提取。图7显示了每个输入(成形丝锥的类型、丝锥的凸角和螺纹数量)和其中一个输出(总长度)的散点图。这些图表明,输入变量和输出变量之间没有明显的关系。每个符号,蓝色正方形,红色圆圈和黄色十字,代表不同类型的成形丝锥(分别为1至3种)。对于其他两个输出:下部长度和上部长度,可以提取相同的结论。因此,需要一种合适的方法来从过程输入变量对丝锥磨损形式进行建模A. Bustillo等人/计算设计与工程学报3(2016)337345~图7.第一次会议。每个预测变量和总长度的散点图然而,在确定最合适的丝锥磨损模型之前,有必要建立一个基线或阈值,以确保数据挖掘模型的正确性能,或因质量低而拒绝其预测。将与测量值相关的预测值的均方根误差(RMSE)作为质量指标。两个基线表22种拟议基线技术的输出和RMSE的数据集变化。下部长度上部长度总长度[公厘][公厘][公厘]平均值0.120.150.27最大0.771.171.78最小000RMSE初始0.140.200.30方法RMSE线性0.120.160.23方法表3方法符号。方法缩略语装袋BG迭代装袋IB随机子空间RSAdaboost R2 R2加法回归AR旋转森林RFREPTree RPM5P模型树M5P支持向量回归机多层感知器MLPk-近邻回归审议了以下办法:第一种是朴素的方法,它认为每个输出的平均值是每个条件的最可能值;第二种是考虑每个输出的3个输入的线性拟合。表2显示了数据集中3个输出中每个输出的平均值、最大值和最小值,以及针对整个数据集的每个输出的朴素方法和线性方法计算的RMSE值。从工业的角度来看,任何将RMSE降低20%以上的预测模型都将为过程工程师提供有关丝锥磨损的有用信息。如第3节所述,测试了回归的主要技术,包括回归树( RepTrees 和 M5P 树 ) , 集 成 ( Bagging , IteratedBagging , Random Subspaces , Adaboost , AdditiveRegression和Rotation Forest),SVR,ANN(MLP)和最近邻回归。表3总结了用于表示这些技术的缩写。关于表示法,还应考虑两点。首先,在Adaboost.R2的情况下,损失函数的类型由后缀“L”,“S”和“E”(分别为线性,平方和指数)表示。第二,在括号(P或U)之间指示树木是否修剪。遵循10 - 10倍交叉验证程序[17],以概括数据挖掘技术的结果。在10折交叉验证中,数据被分为10折。九个折叠用于构建模型,另一个折叠用于评估模型。用交叉验证获得的估计值是每个折叠获得的10个值的平均值。交叉验证重复10次,即10~ 10倍346A. Bustillo等人/计算设计与工程学报3(2016)337表4所有测试的数据挖掘技术的RMSE值。方法下部长度上部长度总长度RMSERMSERMSE天真的方法0.140.200.30线性方法0.120.160.23线性SVR0.09*0.17*0.22*径向SVR0.090.13 *0.16R2 L M5P(P)0.10*0.13*0.15R2 L M5P(U)0.10*0.13*0.15R2 S M5P(U)0.09*0.13*0.15R2 S M5P(P)0.09*0.13*0.15R2 E M5P(P)0.10*0.13*0.15R2 E M5P(U)0.10*0.13*0.15R2 E REPTree(P) 0.12*0.17*0.23*R2 E REPTree(U)0.10*0.17*0.20*R2 S REPTree(U)0.10*0.14*0.18*R2 S REPTree(P)0.11*0.17*0.21*R2 L REPTree(P) 0.11*0.16*0.21*R2 L REPTree(U)0.10*0.16*0.20*MLP0.10*0.13*0.16KNN0.09*0.14*0.18*M5P(P)0.09*0.130.16*M5P(U)0.09*0.130.16*REPTree(P)0.10*0.18*0.21*REPTree(U)0.10*0.17*0.21*BG REPTree(P)0.09*0.17 *0.19*BG REPTree(U)0.09*0.15*0.17*BG M5P(P)0.090.13*0.16*BG M5P(U)0.090.13*0.16*RF REPTree(P)0.09*0.15*0.19*RF REPTree(U)0.080.130.16RF M5P(P)0.090.13*0.16*RF M5P(U)0.090.13*0.16IB REPTree(P)0.10*0.16*0.18*IB REPTree(U)0.10*0.15*0.18*IB M5P(P)0.090.13*0.16*IB M5P(U)0.090.130.16AR M5P(P)0.09*0.130.15AR M5P(U)0.09*0.120.14AR REPTree(P)0.10*0.17*0.20*AR REPTree(U)0.12*0.16*0.20*RS 50% M5P(P)0.10*0.16*0.20*RS 50% M5P(U)0.10*0.15*0.20*RS 50% REPTree0.10*0.16*0.21*(P)RS 50% REPTree0.10*0.16*0.21*(U)RS 75% REPTree0.10*0.16*0.21*(U)RS 75% REPTree0.10*0.16*0.21*(P)RS 75% M5P(P)0.10*0.16*0.20*RS 75% M5P(U)0.10*0.15*0.20*交叉验证,平均每次交叉验证获得的结果,以减少最终估计的方差。通过这种方式,模型的预测是100个模型预测的平均值。Weka软件[38]用于建模和验证。技术参数选择如下:1. 集合中基本回归量的数量设置为1002. 在线性核支持向量回归机中,权衡参数的优化范围为2~ 8,而在径向基支持向量回归机中,C的优化范围为1~ 16,γ的优化范围为10- 5~ 10- 23. 对神经网络的动量、学习速率和神经元个数分别在0.1~ 0.4、0.1 ~ 0.6、5 ~ 15范围4. 在k-最近邻回归器中,最佳邻元数从1到11中选择在表4中,详细的RMSE值显示了研究中的三个输出,其中星号表示每个输出的回归变量在统计学上比最好的回归变量差(每个输出的测试参考是具有较低RMSE的回归变量,以粗体显示)。表2还收集了两种方法的RMSE,作为最终讨论结果的基线。从表4的结果中可以提取两个主要考虑因素:1. 两种方法给出了三个输出的下RMSE:旋转森林,未修剪的REPTree作为下长度的基本回归量,加性回归,未修剪的M5P作为上长度和总长度的基本回归量。然而,第二种方法在统计学上比第一种方法更差,以模拟较低的长度。2. 只有两种方法不会在三个输出中的任何一个中失败:使用未修剪的REPTree作为基础回归的旋转森林(较低长度的获胜者)和使用未修剪的M5P作为基础回归的迭代Bagging最后,如果我们将表4中的这些预测模型的结果与被视为基线的两种方法进行比较,则可能会得出新的结论。首先,所有正在考虑的数据挖掘技术都表现出比简单方法更好的性能(例如, 对于较短的长度,测试技术的RMSE在0.09-0.12 mm范围内,对于初始方法为0.14 mm)。第二,并非所有考虑中的数据挖掘技术都表现出比线性拟合更好的性能(例如,测试技术的上限长度的RMSE在0.12 -0.15 的范围内)。0.18有两个原因可以解释这一结果:首先,由于交叉验证技术导致的数据集大小的减少不适用于线性拟合,这是由于数据集的小尺寸而显著的;第二,在线性拟合情况下对相同的数据进行训练和验证,而应用于数据挖掘模型的交叉验证技术使用在训练步骤中未呈现的新数据进行验证。然而,最重要的结论是,即使数据挖掘由于交叉验证而损失了准确性(因为只有部分实验数据集用于训练阶段,保留部分实例用于验证阶段),仍然有一些数据挖掘模型明显提高了两种基线技术的精度(即在训练阶段使用整个实验数据集)。例如,使用未修剪的REPTree作为基础回归变量的旋转森林将线性拟合的RMSE降低了33%,A. Bustillo等人/计算设计与工程学报3(2016)337347~下长度和以未修剪的M5P作为基础回归量的加性回归分别将上长度和总长度的线性拟合的RMSE降低了25%和39%。考虑到所有这些因素,以未修剪的REPTree作为基础回归变量的轮换森林似乎是最合适的回归变量,可以用来模拟这个工业问题。总 而 言 之 , 最 准 确 的 数 据 挖 掘 技 术 是 以 未 修 剪 的REPTree作为基本回归变量的旋转森林。它预测的下,上和总磨损长度的RMSE分别为0.08,0.13和0.16毫米。在类似的训练条件下,对于相同的输出,朴素方法预测的RMSE 为 0.14 、 0.20 和 0.30 mm , 线 性 方 法 的 RMSE 为0.12、0.16和0.23 mm,在所有情况下都明显高于旋转森林的RMSE5. 结论本文从实验和数据挖掘的角度分析了冷锻钢件攻丝丝锥成形过程中的磨损过程。在成形凸耳上观察到的磨损属于磨料类型。这种类型的磨损意味着涉及连续叶片的叶片直径损失。“类型1“成形丝锥具有最少的磨损并且表现出最好的性能。成形丝锥的几何形状似乎是一个非常重要的因素。The 腔室区域(5个节距)和标称直径周围(6个叶片)的叶片数量越多,导致载荷分布越均匀,成形过程越平缓。本研究的第二个目标是确定最准确的基于数据挖掘的模型来解决这个现实生活中的工业问题。数据集由285个实例组成,有3个输入和3个输出。研究了几种方法,包括最新回归的所有主要技术:回归树、集成、SVR、ANN和k最近邻回归。进行了10 - 10次交叉验证,以概括这些预测结果模型两种基线方法被认为是分析数据挖掘模型的性能:第一种方法认为每个输出的平均值是每个条件的最可能值;第二种方法认为每个输出的3个输入的线性拟合最准确的模型是以未修剪的REPTree作为基本回归量的轮换森林;它将较低长度的线性拟合的RMSE降低了33%,而以未修剪的M5 P作为基本回归量的加性回归将较高长度和总长度的线性拟合的RMSE分别降低了25%和39%。然而,在对较低长度建模时,加性回归在统计学上比轮换森林差,因此,以未修剪的REPTree作为其基础回归量的轮换森林似乎是对该工业问题建模的最合适的回归量。未来的工作将考虑其他集成方法,使用其他方法的集成,而不是回归树,研究非均匀集合模型的使用,通过组合不同方法构建的集合(例如,SVM和RBF),这可能会提高模型的最终精度确认本研究部分 得到了项目TIN 2011 -24046、IPT-2011-1265-020000和DPI 2009 - 2010的支持。06124-E/DPI , 西 班 牙 经 济 和 竞 争 力 部 。 我 们 感 谢UPV/EHU(UFI MECA-1.0.2016(ext))的机械工程UFI的支持。此外,我们衷心感谢内燃 来自Metal Estalki的Azkona和J Ferná
下载后可阅读完整内容,剩余1页未读,立即下载
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功