没有合适的资源?快使用搜索试试~ 我知道了~
埃及信息学杂志19(2018)21全文一种预测问答社区最佳答案的混合模型DaliaElalfy,Walaa Gad,Rasha Ismail信息系统系,计算机信息科学学院,Ain Shams大学,Abbasia,开罗,埃及阿提奇莱因福奥文章历史记录:2016年9月22日收到2017年3月13日修订2017年6月22日接受2017年6月29日在线发布保留字:问答社区知识交流专家最佳答案特征提取内容特征混合分类器A B S T R A C T问答社区(QAC)由于其提供的巨大设施和信息流而被广泛使用。这些社区的目标是在用户之间分享和交流知识。通过在大量类别下提问和回答问题然而,目前存在着许多问题,使得知识的获取变得困难。其中一个问题是,并不是每个提问者都有知识和能力为他的问题选择最佳答案,甚至根据主观因素选择最佳答案。本文的分析是在堆栈溢出社区上进行的。我们提出了一个混合模型来预测最佳答案。该模型由两个模块组成。第一个模块是内容特征,包括三种类型的特征:问答特征、答案内容特征和答案-答案特征。在第二模块中,我们通过使用新的代表分数函数来检验非内容特征在预测最佳答案中的使用。然后我们合并内容和非内容特征,并将它们用于预测。我们进行了实验,使用我们新添加的功能训练三个不同的分类器。预测的准确性是非常有希望的。©2018制作和主办由Elsevier B.V.代表开罗计算机和信息学院大学这是一篇CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍有许多类型的社交网络,你可以通过互联网使用。这些类型取决于每个网络可以提供的功能[1]。这些社交网络之一是协作社交网络 。 Stack Overflow ( http://stackoverflow.com ) , Quora ,Yahoo ! - Answers 和 Never 就 是 这 种 类 型 的 例 子 。 在 stackOverflow社区中,问题回答过程如下所示。用户可以选择一个类别来发布问题。在发布问题后,提问者等待特定的时间,以便从专家用户那里获得答案。专家用户是在问题字段的此类别或子类别如果这个问题没有得到任何答案,提问者可以设置一个赏金。赏金是*通讯作者。电子邮件地址:dallol_elalfy47@hotmail.com(D. Elalfy)。开罗大学计算机和信息系负责同行审查。制作和主办:Elsevier一个特别的声誉奖给答案。此功能旨在激励回答者,并帮助问题得到他们应得的答案。赏金奖励由提供奖励的用户的个人声誉提供资金。声誉是社区对答案作者的信任程度的粗略衡量;如果答案作者说服其他用户他的答案是最好的,并且这个回答者知道他在说什么,那么就可以赢得声誉。虽然赏金制作者不需要是问题的所有者就可以开始对该问题的赏金,但一次只能对一个问题激活一个赏金,并且每个用户一次最多只能有三个活跃的赏金。用户必须有特定的声誉分数才能开始赏金,并且至少与赏金金额一样多的声誉。赏金奖励将在开始时从您的声望中扣除,而不是在奖励时。如果问题收到许多答案,用户可以在其答案线程中对问题和答案进行向上和向下投票。当答案被投票通过,获得奖金或被选为最佳答案时,将获得最高的声誉分数。用户还可以在问题和答案中添加评论。此外,用户还可以将帖子设置为收藏夹。还有其他活动,但要能够使用它们,这取决于社区下的用户权限。用户权限取决于用户信誉分数。这些特权的一个例子是将问题或答案标记为攻击性帖子。http://dx.doi.org/10.1016/j.eij.2017.06.0021110-8665/©2018制作和主办由Elsevier B. V.代表开罗大学计算机和信息学院这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表埃及信息学杂志杂志主页:www.sciencedirect.com22D. Elalfy et al./ Egyptian Informatics Journal 19(2018)21然后,问题的作者可以选择最优选或最满意的答案。这个答案被称为最佳答案或公认答案。不幸的是,这种机制在问答门户网站可能会导致很多问题。例如,有些提问者无法选择接受的答案。回答他们的问题。其后果是留下了许多”没有答案“的问题即使回答了这个问题,回答者也有可能不是这方面的专家。只是回答它,因为当他/她打开问答门户时,他面临着这个问题结果,社区失去了它的目标之一,这是共享知识,因为低质量的答案可以存在。此外,给出低质量答案的回答者能够给出高质量答案,如果该用户面对他/她擅长的正确问题。本文主要研究栈溢出社区中知识的交换与共享问题。以及如何通过节省提问者浪费的时间和精力来简化知识交换,从而使用户能够找到满意的答案。通过预测用户的最佳答案,从而考虑了门户网站中问题回答的主要问题。本文的工作安排如下。第二部分介绍了相关的工作,并对不同的知识交流方式进行了深入的分析。第三部分,研究了文献[3]中给出答案局部信誉值的模型以及我们提出的混合模型。第四节给出了实验结果和讨论。第5节给出了结论2. 相关工作为了改善问答门户的工作机制,我们需要重点加强问答路由方法和寻找最佳答案技术。在这个领域的研究人员做了很多努力来克服这些问题;我们将这些研究分为四类:为特定问题推荐合适的专家,预测最佳答案,寻找合作专家组,直接向专家提问所有这些都是解决方案,以提高用户满意率,给他高质量的答案还可以最大限度地减少由于等待正确的专家回答问题而造成的时间损失2.1. 推荐专家解答当前问题在参考文献[4]中,他们倾向于找到合适的专家来回答某个类别下的特定问题。他们提出了一种混合模型,利用用户声誉、用户权威和用户主题相关性来寻找专家。在评估他们的模型时,他们使用了Yahoo!在台湾的回答平台。也叫Yahoo!知识加。他们根据词语的位置为词语分配不同的优先级,比如这个词是在回答帖子、问题帖子还是在问题标题中。他们的技术中的一个主要问题是他们不考虑专家发布的帖子的质量。因为HITS只把帖子的数量作为该用户权威的指示在参考文献[5]中,他们的目的是推荐合适的用户来回答特定类型的问题。他们将问题分为两类:权威性问题和亲和性问题。他们还建议一个适合回答这类问题的社交网络。作者创建了一个网站,允许来自不同社交网络的用户提问,以获得知识或社交互动。使用的社交网络是Facebook、Myspace和Twitter。权威问题是寻求信息的问题,亲和力问题是寻求社会互动或意见的问题。他们建立了专家评估算法确定提问者和回答者的客观性水平。此客观性级别稍后用于确定亲和性和权限用户。他们没有考虑答案和问题之间的关系,所以答案可能会偏离主题。在参考文献[6]中,企业社交网络(ESN)服务可以帮助员工与同事、客户和供应商进行有效的协作和沟通。本文提出了一个模型,以更好地支持问答过程中的ESN,通过使用图分析的方法。该方法根据提问者输入为了评估其适用性,该方法在中国最流行的ESN平台KDWeibo上实现。该算法包括三个关键概念:兴趣距离、聚集特殊化图(ASG)和特殊化子图(SSG).他们的模型中存在的缺点之一是,如果用户不提供任何潜在回答者的初始列表或初始列表的质量太低,则该方法将不起作用。作者在参考文献[7]中介绍了一个概率框架来预测问题的最佳答案。通过跟踪应答者的历史记录,采用语言模型和潜在Dirichlet分配模型LDA的混合模型来建模应答者的兴趣。他们还在预测中使用用户权限和活动他们利用两个模型来定义用户的兴趣。他们根据用户资料计算似然概率,以预测专家。此外,它们还对用户的先验信息进行建模,由权限和用户活动两部分组成。他们在中国使用Isak CAQ进行了实验。作为对他们工作的反馈,他们需要进一步研究他们在大规模数据集上的工作。并使用更准确和不同的用户活动和权限模型。在参考文献[8]中,作者使用一种机制来过滤接收到的在线社交流,并通过个性化信息分发过程使他们能够与大多数类似用户进行交互。他们的框架通过计算目标用户和其他用户的帖子之间的相似度来识别最适合接收特定帖子的用户。研究中使用的平台是堆栈溢出。相似度是根据用户的社交活动来计算的。用户在向量空间模型中,每个用户用第一个向量是社会模式向量,包含影响力属性和用户分布。第二个向量包含bag of words作为帖子内容的向量。词频和逆文档频率用于加权每个向量的术语。然后应用聚合线性模型将计算出的余弦相似度合并到两个向量中。2.2. 寻找最佳答案在参考文献[9]中,他们专注于在用户注册课程的大规模在线开放课程中找到最佳答案,并进一步了解他们可以在课程论坛中提问和回答问题。实验在openHPI MOOC平台上进行。用户通过训练四个分类器来使 用 机 器 学 习 。 它 们 分 别 是 baging-ging 、 naiveBayes 、MultiPerceptron和使用用户特征、线程特征和内容特征的随机森林。他们使用至少有两个答案的问题作为历史数据。对416个问题的答案进行训练参考文献[10]是一项调查,研究人员发现,发布高质量问题和获得高质量答案之间存在高度相关性。因此,他们研究了问题中最重要的特征,以获得高质量的答案。这些与问题相关的特征是标签和术语、问题的长度、可以帮助用户D. Elalfy等人/Egyptian Informatics Journal 19(2018)2123更了解问题。诸如提问者信誉的提问者相关特征也被提及作为问题帖子的质量的良好指示器。在参考文献[11]中,他们使用Yahoo!回答平台历史数据。该实验是在少数问题上进行的,至少有五个答案,他们提出了13个标准,并要求五名亚马逊土耳其机械工人根据这些特征对答案进行评分。为了确保他们使用高相关性的特征,他们将工人给出的比率与询问者的实际评估相匹配。MTurk的评级为1至5。他们通过将逻辑回归分类器应用于他们的13个特征来进一步研究。他们发现它们的特征高度相关。 所以他们决定使用不同的功能,从回答和问题帖子中提取新的特征。他们的数据集由116个问题和575个答案组成在文献[12]中,他们研究的主要目的是得到影响选择最佳答案的因素。他们对250个堆栈Exchange社区进行了分析,认为这是一个大规模的分析。他们发现,用户并没有通过任何标准来评估答案,以选择它作为最佳答案。他们只是依赖于在认知启发式上,例如这个答案的空间或它在答案线索中的顺序。随着答案数量的增加,用户在投票时更多地依赖于认知启发式,这导致用户的评价不太可靠见参考文件[13]他们调查了问答社区中低质量答案的问题他们发现,目前在这一领域的大部分工作都集中在答案特征上来预测最佳答案,他们忽略了问题类型作为一个特征,该特征决定了应该存在的属性,以确定现有问题的最佳答案。他们将工作分为两部分,第一部分是对问题类型进行分析,以找到最适合的答案特征来训练模型。第二部分是基于问题类型训练质量分类器,并汇总整体答案质量得分。此外,他们提出了新的质量特征来预测最佳答案。他们的实验是在Yahoo!Answers平台拥有约5万个问答对的大数据集。他们发现,他们的层次分类器可以预测低质量的答案比高质量的答案。见参考文件[14]他们提出了一种用于协作学习的问答模型他们的系统是印度尼西亚高中作为电子学习过程的一他们把维基百科作为一个免费的、基于网络的、多语言的百科全书。在系统中发布问题并接收学生的答案和投票后,通过与维基百科数据库进行比较和相似性百分比也提供了一个链接,作为有关答案更多信息的来源然后将所有以前的问题和答案输入到知识库中,以供新学生或可能在学习中遇到相同问题的学生参考。在文献[15]中,研究者试图预测问题的答案是否会被提问者选为最佳答案。他们在堆栈溢出站点上进行研究他们设计了一些特征来训练监督分类器。然后,他们研究预测结果中最具影响力的特征。他们只使用了answer这些特征分为上下文特征、内容特征和问答关系特征,上下文特征是指同一线索下的答案之间的关系,内容特征是指答案本身的统计特征,问答关系特征是指问题的发布时间和回复时间他们发现,上下文特征是预测结果中最重要和最有影响力的特征他们使用了包含196,145个答案的大型数据集分类过程是使用随机森林分类器与两折交叉验证。在参考文献[1]中,他们对Yahoo!答案平台为了推荐高质量的答案,基于信誉评分函数。他们还使用了回答内容特征,并结合了基于内容的方法和声誉评分方法。他们收集了大约13万数据集从四个不同的类别在雅虎!回答平台。他们发现,提出的非内容方法击败了基准链接分析方法,如HITS方法,发现该网络中的用户他们进行了分析,发现网络活动的分布此外,他们发现声誉非内容方法优于内容方法。2.3. 寻找合作专家见参考文件[16]本文作者试图找一组专家合作,给出一个具体问题的答案列的想法是给问题线索一个高持久的价值。他们使用stackOverflow平台进行实验。他们发现,问答过程是一个需要不同用户输入的协作过程。他们引入了用户对用户兼容性的概念。然后提出了一种机制来模拟这个概念的问答社区。该模型是使用用户兼容性,主题专业知识(因为用户必须是同一主题或问题类别的专家)以及用户在特定时间内协作的可用性来构建的,以便只提出一个高质量的答案。2.4. 将问题发送给特定专家参考文献[17],本文首次报道了会话级应答者行为的大规模分析。这项研究的目的是向专家提出有关问题主题的新问题。并对大规模数据进行重用,以满足用户需求。他们回答了许多问题,其中之一是用户倾向于回答问题。以及回答者如何选择要回答的问题这些问题的答案有助于开发更可靠的问题推荐模型。耶!答题平台用在。这种大规模的分析。他们发现用户最多参与两个社区或类别。用户选择了回答他们进入平台时所面临的问题。他们对所有用户进行了分析,他们不考虑超级活跃用户。3. 提出的混合最佳答案预测模型我们提出的模型由两个模块组成,第一个模块是使用内容特征预测最佳答案第二个是使用非内容特征预测最佳答案。然后,我们将它们组合在一个混合模型中,以获得最佳的预测结果。3.1. 内容模型该模型是一个增强的工作参考。[15]第10段。原始模型只考虑答案内容特征。模型参考[15]由三部分组成:单独处理答案内容的特征,即答案内容特征。考虑问题和答案之间关系的特征而度量答案与同一问题下其他答案相似程度的特征称为上下文特征。我们在Ref中的先前模型[3]在答案内容功能下增加了新颖功能新的功能被添加作为增强,它们是根据参考文献[15]中原始模型的结果选择的(见图11)。①的人。24D. Elalfy et al./ Egyptian Informatics Journal 19(2018)21布雷尔所提出的系统在图2中描述。它由三个模块组成。第一个模块是预处理模块,在这个阶段中,问题和答案被预处理,以提取更有效的特征提取阶段的令牌。第二个模块是特征提取,在这个阶段中,新的特征被添加。添加的功能仅在答案内容功能下添加。最后一个阶段是分类,我们选择训练多个监督分类器以获得最准确的结果。3.1.1.内容模型实验与参考文献[3]中的工作一样,我们选择栈溢出作为研究的平台,我们收集了Academic类别(栈溢出类别)下的地面真实数据。我们的数据分为两类最佳答案和非最佳答案类。我们的数据量是18,000个答案。我们已经使用三种不同的分类器,随机森林RF,逻辑回归和朴素贝叶斯,对以前的模型进行了评估。我们用10倍交叉验证训练了随机森林分类器。我们只应用和使用了22个答案内容功能。表1中描述的功能。3.2. 非内容模型该模型是一个增强的工作参考。[1]的文件。主要区别在于文献[1]中的工作是在雅虎问答平台上进行的。他们的部分工作是使用非内容特征来预测最佳答案,非内容特征是用户的声誉得分,表1图二. 基于内容的模型和新增功能的阶段。回答了这个问题我们在堆栈溢出门户中应用了信誉评分函数,并注意到它3.2.1. 基于声誉的非内容模型基于信誉的非内容模型是通过两个分数的相乘来计算的,第一个分数是用户置信度水平分数,第二个分数是用户专业知识水平分数。图3显示了非内容模型的结构。[1]的文件。3.2.2. 用户这是计算参与级别的函数,在每种类型下设计的功能及其说明。类型符号fA ave_comment,var_comment comment_num URL_tag,pic,codeans_len readabilityfQ-A QA-sim时隙fA-A ave_ans_simmin_ans_simmax_ans_simcompetitor_numans_index1回答者和衡量他们的积极性。参与函数f(uij)是一个sigmoid函数,它为回答数量多的用户提供高奖励,而为用户提供较少奖励我爱你1e.-xij-lð1Þ答案的数量很少。所有的答案都在某个血淋淋的类别之下.当回答数超过一定阈值时,奖励的增加幅度较小。其中xij是用户uij在类别Ci中提供的答案的总数,并且m是基于用户的答案分布模式m用于奖励Fig. 1. (混合模型1)内容和非内容模型及其特征描述。D. Elalfy等人/Egyptian Informatics Journal 19(2018)2125G u.-¼¼Ruij¼conuij×expeuij 6R(uij)的值应该在0和1之间。0表示用户uij不是专家,1表示用户是具有高声誉的专家。4. 实验4.1. 数据集描述图三.用户最活跃的用户一些高度活跃的用户比其他高度活跃的用户提供更多的答案。为了进一步奖励这些人,使用参数r,这是答案数量的变化。它被计算为sxij-x2在这项研究中,我们使用了与参考文献[3]中先前模型相同的数据集。地面实况数据从堆栈溢出门户和学术类别收集。我们将数据分为4个窗口,每个窗口有不同的大小。窗口大小分别为8000、11,000、13,000和18,000个回答帖子。数据被标记为非最佳答案和最佳答案类。我们提取了回答者信息,例如用户在该类别中回答的最佳答案的数量。r¼tð2Þ4.2. 系统描述其中x是类别i中的平均应答数。t是类别i中唯一答案作者的总数4.2.1. 用户该功能负责测量用户在特定类别下的经验程度。与参考文献[1]一样,他们发现大多数用户选择的最佳答案数量很少,少数用户选择的最佳答案数量较多。因此,最佳答案得分g(uij)可以通过应用参与函数中的sigmoid函数来驱动。1ij1个月eRb其中yij是用户uij在类别Ci中提供的最佳答案的总数,并且mb是基于用户的最佳答案分布模式确定的阈值。使用参数rb,其中最佳答案的数量的变化由类别I中的用户计算公式为Eq.(二)、4.2.2. 用户用户在本文中,我们已经处理的问题,如果给定的答案将被选为最佳答案或不基于这个答案的非内容特征的预测。我们在文献[1]的基础上推导了我们提出的模型。我们把工作分为三个部分:1- 内容模型与我们之前在Ref.[3]的第11段。2- 非内容模型,它是用户体验水平分数和用户置信水平分数的组合3- 将内容模型和非内容模型相互4.3. 结果和讨论我们使用精确度、召回率和准确度来衡量我们实验的表现。精密度测量,即真阳性tps与所有阳性结果(真阳性tps和假阳性fps)的比例。真阳性意味着分类器正确地将案例分类为最佳答案类。假阳性意味着分类器错误地将案例分类为最佳答案。参与回答问题的程度。这精密tpstpsð7Þ支出fuijguij2ð4Þ召回措施,这是一个分数的真阳性所有阳性类(真阳性t假阴性(falsenegative)假阴性ps ns4.3.1. 置信水平置信水平con(uij),它意味着分类器错误地将案例分类为非最佳答案类。tPS最佳答案yij与用户u ij在类别c i中的答案总数x ij之比。召回1/4吨ps/hð8Þ(yij=xij;如果jyij>0而准确性度量是真实结果的比例(两者都是真实的与此同时,0:0001;如果jyij<$0ð5Þ阳性和真阴性)。置信度函数确保具有高数量的最佳答案的用户具有比其他用户更高的分数区分有少量答案但大多数是最佳答案的新用户和有大量答案但少数是最佳答案的用户Accuracytpstpsfpsfns4.3.1. 仅使用内容功能的结果ð9Þ3.2.6. 信誉分数用户在特定类别中的信誉分数由置信水平con(uij)和专业知识水平expe(uij)两者确定。我们选择仅使用内容特征来训练随机森林分类器,逻辑回归和朴素贝叶斯。随机森林分类器与200棵树和10折交叉验证,同时考虑5个随机特征。随机特征的选取采用Weka框架。用户用户水平用户的参与水平用户信誉分数Þ¼NS26D. Elalfy et al./ Egyptian Informatics Journal 19(2018)21在表2中,我们将地面实况数据划分为多个部分,每个部分称为窗口大小。我们分阶段训练分类器,每个阶段包含不同的窗口大小。为了考察增加数据集对分类器精度的影响。在窗口大小8000答案集。Logistic回归分类器的最佳预测准确率为76.87%。随机森林的预测精度为75.98%,朴素贝叶斯的预测精度为73.98%。第二个窗口大小是11,000个答案。正如你所看到的,逻辑回归和朴素贝叶斯的预测精度都有所下降。而随机森林分类器提高了5%,这是一个很好的指标,随机森林分类器是适合我们的数据集。因为它在处理大数据集时是一个强大而有效的分类器。在窗口大小为13,000时,很明显,通过增加窗口大小,分类器的行为不会改变。因此,逻辑回归和朴素贝叶斯的准确性仍然下降。分别为74.05%和66.13%。随机森林增加了4%,达到84.12%。在窗口大小为18,000的情况下,分类器的相同行为(除了逻辑回归)略有增加。随机森林分类器仍然击败了另一个。准确率提高到88.36%。使用随机森林分类器时最准确的预测精度。一般来说,在随机森林中,随着窗口大小的增加,预测精度增加。图4示出了分类器行为相对于x轴中的不同窗口大小和y轴中的很4.3.2. 仅使用本地信誉分数的结果同样的分析被应用于仅使用非内容特征的数据集,这是我们提出的声誉评分模型RNC。在这里,分类器仅使用答案作者和预测类的声誉得分进行训练。表3显示了使用不同窗口大小的预测精度结果。如表3所示,三个分类器的行为几乎是相同的随机森林、朴素贝叶斯和逻辑回归预测精度随着窗口大小的增加而降低。在窗口大小8000答案集。随机森林分类器的最佳预测精度为74.148%。其次是logistic回归和naïve Bayes,总正确率为73.635%。第二个窗口大小是11,000个答案。你可以观察到,所有分类器的预测精度都有所下降。在窗口大小为13,000时,很明显,通过增加窗口大小,分类器的行为不会改变,它仍然会受到预测精度下降的影响。在窗口大小为18,000的情况下,所有分类器的结果开始增加,但报告的结果仍然少于第一个。图图5示出了我们的本地信誉分类器行为相对于X轴中的不同窗口大小和y轴中的预测准确性之间的比较。当我们增加窗口大小时,分类器报告准确性降低4.3.3. 混合模型1(使用内容和非内容功能)在本小节中,我们研究了合并先前的内容特征和非内容特征(本地声誉)的影响。预测准确度结果列于表4中。表2内容分类器中的最佳答案预测精度分类器预测精度窗口大小(回答数)精度召回精度随机森林0.7350.7675.98%80000.8080.808百分之八十点八四11,0000.8420.84184.12%13,0000.8840.88488.36%18,000Logistic回归0.7470.76976.87%80000.7190.72172.09%11,0000.740.74174.05%13,0000.7760.78百分之七十七点九五18,000朴素贝叶斯0.7180.74百分之七十三点九八80000.6860.68368.33%11,0000.70.66166.13%13,0000.7380.66366.82%18,000见图4。 内容分类器结果。D. Elalfy等人/Egyptian Informatics Journal 19(2018)2127我们发现在内容分类器中加入非内容特征并不会对预测精度产生积极的影响并没有减少很多,减少的百分比约为0.05,这是一个不显著的变化。图6示出了在标题混合模型1下使用内容和本地信誉非内容特征两者的分类器之间的比较。x轴为不同窗口大小的比较,y轴为预测精度的比较。分类器报告几乎相同的行为和准确性,在使用con-只有帐篷的特点。随机森林分类器仍然是最好的,其准确率为88.34%,使用窗口大小为18,000(见图1和图2)。 7-10)。4.3.4. 仅使用堆栈over流信誉分数(SR)我们决定使用和应用堆栈溢出声誉得分,而不是我们的本地声誉模型下表显示了仅使用堆栈溢出社区给出的声誉分数的三个分类器的预测准确性(参见表5)。令人惊讶的是,我们发现,使用堆栈溢出的声誉得分在预测并没有取得很高的提高准确性。我们的信誉模型和堆栈溢出信誉模型在预测精度上几乎相同此外,我们的声誉得分略高于堆栈溢出。表3RNC模型中的最佳答案预测准确度(仅限本地声誉得分)。分类器预测精度窗口大小(回答数)精度召回精度随机森林0.7110.74174.148%80000.6330.6463.96%11,0000.6280.62662.60%13,0000.6610.678百分之六十七点七五18,000Logistic回归0.5420.73673.635%80000.6070.61561.52%11,0000.4270.5858.03%13,0000.4120.64264.16%18,000朴素贝叶斯0.5420.73673.635%80000.6070.61561.52%11,0000.5870.58758.73%13,0000.4120.64264.16%18,000图五. 本地声誉分类器结果。表4在分类器中添加内容和非内容特征后的最佳答案预测精度(混合模型1)。分类器预测精度窗口大小(回答数)精度召回精度随机森林0.7340.75975.93%80000.8040.803百分之八十点三二11,0000.1590.84183.96%13,0000.8840.88388.34%18,000Logistic回归0.7470.76976.88%80000.7190.72172.14%11,0000.2650.73673.61%13,0000.7760.7877.98%18,000朴素贝叶斯0.5020.7474.034%80000.6850.68268.22%11,0000.7380.66666.57%13,0000.7380.66666.58%18,00028D. Elalfy et al./ Egyptian Informatics Journal 19(2018)21图第六章混合模型1结果。见图7。堆栈溢出信誉分数结果。图八、混合模型2结果。见图9。 分离的非内容结果。D. Elalfy等人/Egyptian Informatics Journal 19(2018)2129图10. 混合模型3结果。4.3.5. 混合动力车型2表6捕获了使用堆栈溢出非内容特征和内容特征的分类器的预测准确性我们发现,随着窗口大小的增加,预测准确度增加,并且将混合模型1 HCR结果与混合模型2 HSR进行比较,我们发现在第一和第二窗口大小中,混合模型2的结果高出0.13%。在第三和第四个窗口大小中,情况正好相反在一般情况下,混合模型1和混合模型2的预测精度相同这两种方法都低于我们只使用内容特征训练分类器我们得到的更高的准确率是当使用内容功能时,只有88.36%。在分类过程中同时使用内容和堆栈溢出非内容信誉分数比仅使用堆栈溢出信誉分数更好。但混合模型1的预测精度仍高于混合模型2。4.3.6. 分离非内容模型我们扩展了我们的分析,以调查分离的非内容特征。使用的非内容特征是在该问题类别中对回答者的回答次数以及该用户在该类别中的最佳答案次数。我们在表7中报告了分类器的预测结果。表5在分类器SR中使用非内容特征的最佳答案预测精度(仅适用于堆栈溢出声誉模型)。分类器预测精度窗口大小(回答数)精度召回精度随机森林0.6390.7373.03%80000.6240.633百分之六十三点二五11,0000.6280.62762.73%13,0000.6590.67767.69%18,000Logistic回归0.5420.73673.64%80000.540.57757.71%11,0000.560.55555.53%13,0000.4120.64264.16%18,000朴素贝叶斯0.5420.73673.64%80000.5720.59259.15%11,0000.5660.55355.32%13,0000.4120.64264.16%18,000表6在分类器(混合模型2 HSR)中添加内容和堆栈溢出非内容特征后的最佳答案预测精度分类器预测精度窗口大小(回答数)精度召回精度随机森林0.7370.76176.08%80000.8080.80880.76%11,0000.840.83983.88%13,0000.8820.88188.13%18,000Logistic回归0.7460.76976.86%80000.7170.7271.97%11,0000.7380.73873.77%13,0000.7780.78178.13%18,000朴素贝叶斯0.7190.74174.05%80000.6910.68668.60%11,0000.7030.66766.69%13,0000.6390.67867.80%18,00030D. Elalfy et al./ Egyptian Informatics Journal 19(2018)21表7在分类器中使用非内容分离特征的最佳答案预测精度分类器预测精度窗口大小(回答数)精度召回精度随机森林0.7170.74274.23%80000.6330.6464.01%11,0000.6310.63百分之六十二点九五13,0000.6610.6767.47%18,000Logistic回归0.6330.6473.17%80000.6010.60560.54%11,0000.5930.58558.48%13,0000.5960.64264.20%18,000朴素贝叶斯0.6890.70370.32%80000.5590.53858.26%11,0000.560.54454.42%13,0000.4120.64264.16%18,000表8在分类器中使用内容和非内容分离特征的最佳答案预测精度分类器预测精度窗口大小(回答数)精度召回精度随机森林0.7380.76276.22%80000.8120.81281.19%11,0000.8460.84584.50%13,0000.8870.88788.65%18,000Logistic回归0.7480.7776.99%80000.7220.72472.39%11,0000.7410.74174.11%13,0000.7790.78278.12%18,000朴素贝叶斯0.7190.74174.09%80000.690.686百分之六十八点六11,0000.6690.66966.90%13,0000.7350.67967.93%18,000表9三种非内容模型预测精度的比较非内容分类器预测精度窗口大小(回答数)随机森林Logistic回归朴素贝叶斯我们的本地声誉模型1(RP)栈溢出信誉百分之六十七点七五67.69%64.16%64.16%64.16%64.16%18,000模型2(SR)分离式非内容模型3(SP)67.47%64.20%64.16%正如你在图中看到的。 9、三个分类器的结果大多相同。行为也是一样的。当在所有分类器中使用最小窗口大小时,预测结果更高。但随机森林队还是打败了其他队。4.3.7. 混合动力车型3然后,我们将具有非内容分离特征的内容两者添加到分类模型中以检查添加的效果,并且结果在表8中示出。非内容分离特征分别是用户y在类别x中参与回答的数量和用户y在类别x中最佳回答的数量。在表8中,介绍了混合模型3。包含答案内容特征和非内容分离特征,即该答案在该类别中的参与人数和该答案在同一问题类别中的最佳答案数。我们发现,像往常一样,随机森林分类器其他分类器的预测精度。最后,我们通过混合模型3得到了一个有希望的结果,因为它使用18,000个窗口大小以及随机森林分类器的预测准确率为88.65%(见图3)。 10)。4.3.8. 比较结果在表9中,我们比较了三种非内容模型的预测精度。在表9中,我们连续比较了表3、5和7中的所有非内容模型的我们得出的结论是,如果你想训练一个模型来预测仅基于非内容特征的最佳答案,你可以使用随机森林分类器和我们的本地信誉分数特征,而不是使用堆栈溢出信誉分数或分离的非内容特征来获得更高的预测准确性。在表10中,我们比较了表4、6和8中引入的三种混合模型,我们发现所有分类器都有相同的趋势。D. Elalfy等人/Egyptian Informatics Journal 19(2018)2131表10比较三种混合模型的预测精度。分类器预测精度窗口大小(回答数)随机森林Logistic回归朴素贝叶斯混合88.34%77.98%66.58%18,000模型1(HCR)混合88.13%78.13%67.80%模型2(HSR)混合88.65%78.12%67.93%模型3(HSP)其中随着窗口大小的增加,预测精度也随之提高。随机森林是一种可靠的、鲁棒的分类器,随着数据集数量的增加,它的效果会更好,这是一个合理的结果在表2中的混合模型1中,其是内容特征和我们的本地非内容信誉特征之间的组合。我们发现,使用窗口大小为18,000的随机森林分类器的准确率为88.34%。在表4中的混合模型2中,其是内容特征和堆栈溢出非内容信誉特征之间的组合。我们发现,使用窗口大小为18,000的随机森林在表8中的混合模型3中,其是内容特征和非内容分离特征之间的组合我们发现,使用窗口大小为18,000的随机森林分类器的准确率为88.65%。我们总结了我们的发现报告,使用内容和非内容分离的功能(混合模型3)在预测最佳答案是最好的,给我们更高的准确性比所有其他。5. 结论在本文中,我们致力于问答社区。以及阻碍这些社区实现高质量知识共享和交流目标的问题。然后,我们讨论了我们以前的模型在预测最佳答案的QAC和我们的发现,仅使用内容功能。在此基础上,我们提出了一种只使用非内容特征的模型,并将其应用于不同的平台,即yahoo Answers。并将引入的非内容模型与两种不同的非内容模型的结果进行了我们检查了单独使用非内容模型的影响。最后,我们介绍了一种不同的混合模型,它是我们的内容模型和非内容模型的组合。此外,我们比较了混合模型的结果。我们的结论是,混合模型3与内容模型和分离的非内容特征的合并过程我们在堆栈溢出CQA平台上进行了实验,发现单独使用我们引入的非内容模型比使用堆栈溢出非内容模型或使用分离的非内容模型更好,因为它对提高预测精度有积极的影响引用[1] 陈琳,纳亚克·里奇。利用网络信息评估协作问答门户中的回答质量。Soc NetwAnalMin 2012;2(3):197-215.[2] 企业社交网络。In:Services Computing Conference(APSCC),Asia- Pacific:IEEE; 2012.[3] Elalfy Dalia,Gad Walaa,Ismail Rasha.基于内容和情感分析预测社区问题的最佳答案。2015年IEEE第七届智能计算与信息系统国际会议(ICICIS)IEEE; 2015年。[4] 刘敦仁等整合专家资料、声誉与连结分析于问答网站中之专家搜寻。Inf ProcessManage(2013);49(1):312-329.[5] 詹贾斯
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++标准程序库:权威指南
- Java解惑:奇数判断误区与改进方法
- C++编程必读:20种设计模式详解与实战
- LM3S8962微控制器数据手册
- 51单片机C语言实战教程:从入门到精通
- Spring3.0权威指南:JavaEE6实战
- Win32多线程程序设计详解
- Lucene2.9.1开发全攻略:从环境配置到索引创建
- 内存虚拟硬盘技术:提升电脑速度的秘密武器
- Java操作数据库:保存与显示图片到数据库及页面
- ISO14001:2004环境管理体系要求详解
- ShopExV4.8二次开发详解
- 企业形象与产品推广一站式网站建设技术方案揭秘
- Shopex二次开发:触发器与控制器重定向技术详解
- FPGA开发实战指南:创新设计与进阶技巧
- ShopExV4.8二次开发入门:解决升级问题与功能扩展
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功