没有合适的资源?快使用搜索试试~ 我知道了~
用于行为数据分析的异常模型挖掘阿德内·贝尔福迪尔引用此版本:Adnene Belfodil用于行为数据分析的异常模型挖掘。文档和文本处理。里昂大学,2019年。英语NNT:2019LYSEI 086。电话:02335097v2HAL Id:tel-02335097https://hal.science/tel-02335097v22020年7月16日提交HAL是一个多学科的开放获取档案馆,用于存放和传播科学研究文件,无论它们是否已这些文件可能来自法国或国外的教学和研究机构,或来自公共或私人研究中心。L’archive ouverte pluridisciplinaireCette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留订单The`seDeDocToraTDelope're'e au sein deL’INSA“Ecole DocTorale N” 51zMaTheMA TI QUESE T Iw~orMA TI QUE(Iw~oMaths)SPe′CIALITe′/DISCIPlIweDeDocToraT:Iw~orMATIQUEA`soutenirquiementparAdnE nE BELfodIL面向行为数据分析陪审团组成后:西赫姆·阿梅-叶海亚 法国国家科学研究中心报告员阿诺·西贝斯为了你的安全,你的安全,你的安全特别报告员阿诺·克诺贝我去开会,你去莱顿考官约阿纳·马诺列斯库Directrice de recherche,INRIA考试Amedeo Napoli法国国家科学研究中心研究考官菲利普·拉马尔在南非,你可以在这里学习。Directeur de the` se西尔维·卡扎伦斯我在南非的时候,共同直接的RICEDETHE` SE马克·普兰特维特我想和你谈谈,你没有看到克劳德·贝尔纳德·Ly在1Co-directeur de the` seCette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留Département FEDORA -单点ECOLE DOCTORALE负责人姓名和协调人ChimieCHIMIE DE LYONhttp://www.edchimie-lyon.frwww.example.com:Renée EL MELHEM Bât.Blaise PASCAL,第三secretariat@edchimie-lyon.frINSA:R.古尔东M. Stéphane DanieleInstitut de recherches sur la catalyse etÉquipe CDFA2 Avenue Albert EINSTEIN69 626 VilleurbanneCEDEXdirecteur@edchimie-lyon.frE.E.A.电子、电子技术、自动化http://edeea.ec-lyon.fr秒:M.C. HAVGOUDOUKIANecole-doctorale. ec-lyon.frM. GérardSCORLETTI里昂中央学校36 Avenue Guy DE COLLONGUE69 134 Écully电话:04.72.18.60.97传真:04.78.43.37.17gerard. ec-lyon.frE2M2进化,进化,微生物,调制http://e2m2.universite-lyon.fr秒:Sylvie ROBERJOTBât. Atrium,UCB Lyon1电话:04.72.44.83.62INSA:H. 查尔斯univ-lyon1.frM.菲利普·诺曼德UMR 5557实验室。Claude BernardLyon 1 Bâtiment Mendel1918年11月11日大道43号69 622维勒班CEDEXphilippe. univ-lyon1.frEDISS跨学科科学-圣弗朗西斯科http://www.ediss-lyon.frwww.example.com:Sylvie ROBERJOTBât. Atrium,UCB Lyon1电话:04.72.44.83.62INSA:M. 拉加德univ-lyon1.frEmmanuelle CANET-SOULAS女士,U1060,CarMen实验室,里昂大学1Bâtiment IMBL11 Avenue Jean CAPELLE INSA de Lyon69 621维勒班电话:04.72.68.49.09传真:04.72.68.49.16邮箱:emmanuelle. univ-lyon1.fr信息数学信息与数学http://edinfomaths.universite-lyon.fr秒:Renée EL MELHEMBât. Blaise PASCAL,3岁电话:04.72.43.80.46infomaths@univ-lyon1.frM.卢卡·赞博尼·巴特巴克尼43 Boulevard du 11 novembre 191869 622维勒班CEDEX电话:04.26.23.45.52zamboni@maths.univ-lyon1.fr马泰里奥MATERIAUX DE LYONhttp://ed34.universite-lyon.fr秒:Stéphanie Zhao VIN电话:04.72.43.71.70巴特方向电子邮件:insa-lyon.frM. Jean-YvesBUFFIYURRE INSA deLyon马泰-巴特。圣埃克苏佩里7Avenue Jean CAPELLE69 621维勒班CEDEX电话:04.72.43.71.70传真:04.72.43.85.28jean-yves. insa-lyon.frMegaMÉCANIQUE,ÉNERGÉTIQUE,GÉNIECIVIL,ACOUSTIQUEhttp://edmega.universite-lyon.fr秒:Stéphanie Zhao VIN电话:04.72.43.71.70巴特方向mega@insa-lyon.frM. JocelynBONJOURINSA de LyonBathatoire CETHILBâtiment Sadi-Carnot9,rue de la Physique69 621维勒班CEDEXjocelyn. insa-lyon.frCette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留ScSoScSo*http://ed483.univ-lyon2.frwww.example.com:Véronique GUICHARDINSA:J.Y. 杜桑电话:04.78.69.72.76veronique. univ-lyon2.frM.里昂第二大学巴斯德街86号69 365里昂CEDEX 07christian. univ-lyon2.fr*ScSo:Histoire,Geographie,Améneste,Urbanisme,Archéologie,Science politique,Sociologie,AnthropologieCette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留出版物P职位空缺提出在本文本论文的贡献出现在以下出版物中:P EER-R EVIEWEDI NTERNATIONAL期刊• Adnene Belfodil、Sylvie Cazalens、Philippe Lamarre和Marc Plantevit。识别组之间的异常(不)一致 在数据挖掘和知识发现中被接受。P EER-R EVIEWEDI NTERNATIONALC会议• Adnene Belfodil , Wouter Duivesteijn , Marc Plantevit , Sylvie Cazalens andPhilippe Lamarre.偏离:发现群体内的显著异常(不一致)协议。在2019年的欧洲机器学习和数据库知识发现联合会议。• Adnene Belfodil、Sylvie Cazalens、Philippe Lamarre和Marc Plantevit。闪点:发现投票或评级数据中的异常配对行为在联合欧洲会议机器学习和知识发现数据库(ECML/PKDD),第442-458页,2017年。P EER-R EVIEWED国家C会议• Charles de Lacombe,Antoine Morel,Adnene Belfodil,François Portet,CyrilLabbé,Sylvie Cazalens,Marc Plantevit and Philippe Lamarre.分析与例外情况有关的成分,通过文本说明 1。In Extraction et Gestion des connais- sances -Démo Track(EGC),第437-440页,2019年1获EGC'2019颁奖委员会颁发年度最佳演示论文奖Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留C会议论文不覆盖在本文• Adnene Belfodil , Aimene Belfodil , Anes Bendimerad , Philippe Lamarre ,Celine Robardet,Mehdi Kaytoue and Marc Plantevit.FSSD-一种快速有效的子组集发现算法。在2019。• Aimene Belfodil Adnene Belfodil和Mehdi Kaytoue。使用项目间的含义挖掘形式概念。在形式概念分析国际会议(ICFCA),第173-190页,2019年。• Aimene Belfodil Adnene Belfodil和Mehdi Kaytoue。保证在数值域中的任意时间子群发现2.在联合欧洲会议机器学习和知识发现数据库(ECML/PKDD),第500-516页,2018年。2被ECML/PKDDCette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留“Science- 施瓦茨,2008年-Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留关键词:子群发现,异常模型挖掘,行为数据分析,计算新闻。摘要随着收集和管理与各个领域相关的数据(例如政府数据、教育数据、环境数据或产品评级)的数据平台的迅速扩散这提供了一个无与伦比的机会来研究个人的行为和他们之间的相互作用在政治领域,能够查询投票记录的数据集为数据记者和政治分析师提供了有趣的见解。特别是,这些数据可用于调查特别一致/有争议的主题。考虑描述欧洲议会(EP)投票行为的数据。这样的数据集记录了每个成员(MEP)在议会举行的投票会议上的投票,以及关于议员的信息(例如,性别、国家政党、欧洲政党联盟)和会议(例如, 主题,日期)。 该数据集提供了研究一致子群的一致性或不一致性的机会,特别是突出意外行为。预计在大多数投票会议上,欧洲议会议员将按照其欧洲政党联盟的路线然而,当事情对欧洲内部的特定国家感兴趣例如,当一个关于捕鱼权的立法程序被提交给欧洲议会议员时,可以预期英国这个岛国会就一个具体的行动方针达成一致,而不管他们的政党联盟如何,从而在存在强烈两极分化的情况下达成一个特殊的协议。在这篇论文中,我们的目标是发现这种特殊的(不)协议模式,不仅在投票数据,而且在更通用的数据,称为行为数据,其中涉及个人执行可观察到的行动的实体。我们设计了两种新的方法,提供互补的角度异常(不)协议的行为数据:组内和组间。这两种方法称为Debunk和Deviant,理想情况下,可以实现一个足够全面的工具来突出,总结和分析行为数据中的异常行为我们彻底调查所设计的方法的定性和定量性能此外,我们激励他们的使用计算新闻的背景下。Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留标题:Fouille de Modèles Exceptionnels dans les Données Comportementales.Mots-Clés:Découverte de Sous-Groupes,Fouille de Modèles Exceptionnels,Analyse de Données Comportementales,Journalisme Computationnel.简历随着知识平台的迅速发展,知识平台的相关知识在多个领域得到了广泛的传播,包括政府知识、教育知识、教育知识或产品知识,而且知识也可以在法律上使用Ceci代表了一个学习个人行为和相互作用的机会。在政治计划中,询问投票者的权力可以为记者和政治分析家提供感兴趣的信息。特别是,这种类型的données可能会被利用来调查这种例外的冲突考虑欧洲议会(PE)的投票会议。Un tel ensemble de données enregistre les votesde chaque député(MPE)dansgenre,parti national,parti européen)et des sessions(e.g.,sujet,date).这提供了研究小组成员的同样,他出席了大多数届会,代表们的投票都是各自政党的政治立场。然而,这些问题往往与欧洲国家的利益有关,这些联盟可能是前者或后者如果在人道主义方面提出一项关于和平的立法程序,则王国-联合王国各岛屿国家的和平可能会在没有各自联盟政治立场差异影响的情况下达成一致,这可能是一项与习惯性两极分化观察相比的例外协议在这一点上,我们关注的是这种类型的主题,这些主题代表了协定的例外,而不是对那些被称为“重要”的类似的候选人的投票的影响。我们将两种方法称为Debunk和Deviant。第一次允许各集团签署例外协定,第二次允许签署例外协定,因为这些例外协定可能存在于同一集团理想的是,这两种方法都是为了在所有的组件中实现一个完整和一致的组件例外。在评估两种方法的能力时,我们客观地评估了多种方法的定量和定性性能此外,我们的动机l'utilisation des methodes proposées在le contexte du journalismecomputationnel。Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留内容出版物i摘要v简历七目录.ix图十三表15定义列表xvii1介绍11.1行为数据41.2行为数据分析71.3研究问题121.4捐款. 131.4.1从行为数据到特殊的群体间(Diss)协议1.4.2从行为数据到异常的组内(Diss)协议141.4.3一个用于分析异常投票行为的14Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留1.5第十五章大纲2子组发现和异常模型挖掘2.1一.导言. 182.2发现18亚组2.2.1论描述语言2.2.2论子群的似然性评价302.2.3探索太空342.3异常模型挖掘382.3.1论描述语言和论搜索空间探索2.3.2论模型类和可度量性412.4标准探索算法442.4.1SD/EMM46的标准枚举算法2.4.2SD/EMM48的一个标准分支定界算法2.5潜力与局限513确定群体之间的533.1导言. 543.2设置和问题形式化573.2.1第57章3.2.2正式问题定义583.3组间一致性测量和一致性评估593.3.1质量标准603.3.2组间一致性相似性(IAS)603.3.3国际会计准则措施的例子613.3.4讨论623.4挖掘异常组间协议模式623.4.1枚举候选人子组623.4.2分层多标签属性(HMT)633.4.3对质量指标653.4.4算法DEBuNk703.5组间一致性模式抽样713.5.1基于频率的采样(步骤1)723.5.2RWC -上下文随机游走(第2步)753.5.3快速算法763.6实证研究783.6.1目标和数据集783.6.2定性研究80Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留3.6.3定量研究863.6.4讨论.953.7摘要964查明各群体内的994.1导言. 1004.2设置和问题形式化1024.2.1102.第102章4.2.2正式问题定义1034.3集团内部协议措施1044.4异常上下文:评估和修剪1074.4.1一个子群的度量例外1074.4.2删除搜索空间1114.5关于处理评分者之间1164.6分支定界解:算法DEvIANT1174.6.1枚举候选人子组1174.6.2算法DEvIANT1174.7实证研究1194.7.1目标和数据集1194.7.2定性研究1204.7.3定量研究1234.8摘要1285计算新闻的行为数据分析1295.1导言. 1305.2平台ANCORE1325.3用例:计算事实检查/线索发现1375.3.1使用ANCORE137进行事实核查5.3.2使用ANCORE142寻找电极导线5.4摘要1456结论1476.1摘要1476.2展望1516.2.1丰富ANCORE151的可视化工具6.2.2发现行为数据1526.2.3发现组内/组间一致性1526.2.4Anytime异常行为挖掘153Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留附录155ADEBuNk和Quick-DEBuNk在合成数据155A.1与SD/EMM方法的A.2对噪声的鲁棒性和发现隐藏模式161B多重比较问题163C符号表(第1章和第2章)167D第三章:第三章E第四章:第四章参考文献173Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留图目录1.1作为属性二分图的42.1描述个体及其是否患有肺癌的患者数据集192.2子组发现任务的构建块(摘要)242.3图案结构(G,(D,±),δ)的图示282.4异常模型挖掘任务的构建块(摘要)402.5EMM42中回归模型类的说明2.6EnumCC48枚举的区域和封闭描述的图示2.7B B4SDEMM枚举的有趣闭子群的插图。503.1发现群体之间的3.2由一组标记及其平面表示标记的记录的集合。633.3两个HMT描述之间的合取运算符的图示643.4Quick-DEBuNk approach in a nutshell723.5表3.4中模式1的插图813.6表3.6中模式2的假象833.7表3.7中模式3的假象843.8表3.8中模式3和4的插图853.9DEBuNk和DSC完整结果的比较3.10 DEBuNk和DSC的top-k结果之间的比较3.11 考虑到EPD的 DEBuNk的有效性83.12 考虑Movielens89的DEBuNk的有效性3.13 DEBuNk考虑Yelp89的有效性3.14 HMT对项集封闭描述枚举的效率903.15 DEBuNk在EPD891Cette thèse est accessible à l'adresse:http://theses.insa-lyon.fr/publication/2019LYSEI086/these.pdf© [A. Belfodil],[2019],INSA Lyon,所有权利保留3.16 Movielens92上DEBuNk的有效性和缩放3.17 DEBuNk在Yelp92上的有效性和扩展性3.18 Quick-DEBuNk与DEBuNk在EPD上的效率比较8943.19 Quick-DEBuNk与DEBuNk在Movielens94上的效率比较3.20 Quick-DEBuNk与DEBuNk在Yelp94上的效率比较3.21 用于识别组间964.1发现群体内部的1014.2安全子搜索空间修剪1114.3表4.4模式1的图示1214.4EPD 8上错误发现的分布示意图1234.5CHUS123上错误发现的分布示意图4.6Movielens124上错误发现的分布示意图4.7Yelp124上错误发现的分布图4.8DevIANT和Naive算法1254.9DEVIANT对EPD的有效性81264.10 DevIANT对CHUS127的有效性4.11 DevIANT对Movielens127的有效性4.12 Deviant在Yelp127上的有效性4.13 用于识别组内异常(不)一致的EMM(摘要)1285.1计算事实核查主要步骤1305.2假新闻的类型学1315.3平台ANCORE132的全球概况5.4用于查询ANCORE133中的DEBuNk的GUI5.5用于查询ANCORE134中的偏离的GUI5.6ANCORE135中聚合视图的图示5.7组间协议模式1365.8集团内部特殊协议模式的详细视图一1365.9用于事实核查情景的ANCORE图示I1385.10 事实核查情景二1395.11 事实核查方案三1415.12 集团内部特殊协议的详细视图5.13 通过ANCORE142说明EPP组中的冲突背景5.14 导线查找场景I1435.15 导线探测方案II1445.16 用于铅探测方案III144A.1Cosmic158的输入数据格式示例A.2DEBuNk和Quick-DEBuNk160之间的比较定性性能研究A.3DEBuNk和Quick-DEBuNk w.r.t.行为数据中的噪声...........................................161
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 探索数据转换实验平台在设备装置中的应用
- 使用git-log-to-tikz.py将Git日志转换为TIKZ图形
- 小栗子源码2.9.3版本发布
- 使用Tinder-Hack-Client实现Tinder API交互
- Android Studio新模板:个性化Material Design导航抽屉
- React API分页模块:数据获取与页面管理
- C语言实现顺序表的动态分配方法
- 光催化分解水产氢固溶体催化剂制备技术揭秘
- VS2013环境下tinyxml库的32位与64位编译指南
- 网易云歌词情感分析系统实现与架构
- React应用展示GitHub用户详细信息及项目分析
- LayUI2.1.6帮助文档API功能详解
- 全栈开发实现的chatgpt应用可打包小程序/H5/App
- C++实现顺序表的动态内存分配技术
- Java制作水果格斗游戏:策略与随机性的结合
- 基于若依框架的后台管理系统开发实例解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功