没有合适的资源?快使用搜索试试~ 我知道了~
0博士论文0n0工程与微技术科学博士学位0勃艮第大学0在客户关系管理中管理社交网络数据的平台0I AN B ASAILLE -G AHITTE Soutenue publiquement le 9 f´evrier 2018 devant le Jury compos´e de :0博士论文0工程与微技术科学博士学位0勃艮第大学0为了获得勃艮第大学博士学位0I AN B ASAILLE -G AHITTE0在客户关系管理中管理社交网络数据的平台0专业:计算机科学0于2018年2月9日公开答辩,评审委员会成员如下:0研究单位:Laboratoire Electronique, Informatique et Image - CNRSFRE 2005 CNRS, Arts et Métiers, Univ. Bourgogne Franche-Comté0评审人 Marie-Christine Fauvet 教授,格勒诺布尔阿尔卑斯大学0评审人 Bernard Espinasse 教授,艾克斯 - 马赛大学0考官 Zohra Bellahsene 教授,蒙彼利埃大学0考官 Allel Hadjali 教授,普瓦捷尔ENSMA0导师 Nadine Cullot 教授,勃艮第大学0合作导师 Eric Leclercq,勃艮第大学讲师0N ◦ X X X0远隔千里0所以这是永恒的0现实只是一个词,基于0关于价值观和经过时间考验的原则0而梦想永远延续。0- Ian Curtis,手写便条,约1979年0永远不要消失vii0致谢0首先,我要感谢Nadine Cullot和EricLeclercq,他们在整个博士期间给予了我指导和宝贵的经验,对我的工作的完成起到了决定性的作用。0我要向Marie-Christine Fauvet和BernardEspinasse表示衷心的感谢,他们同意成为我的论文评审人,以及Zohra Bellahsene和AllelHadjali愿意成为我的评审委员会成员。0我要感谢MarinetteSavonnet在校对这篇论文和整个博士期间给予我的帮助。我还要感谢我在Le2i实验室遇到的成员,无论是在博士期间还是之前,他们给予了我宝贵的建议:Jean-Luc Baril, Albert Dipanda,Elisabeth Gavignet, Thierry Grison, David Gross-Amblard, Marc Neveu, Denis Pellion,Marie-Noëlle Terrasse, Olivier Togni和Kokou Yétongnon。0我要感谢eb-Lab公司的EmmanuelMignot在整个项目中的支持和帮助,并且让我在CIFRE合同结束后继续进行。我还要感谢ANRT在CIFRE奖学金2012/0261的框架下资助这项工作。0我还要感谢eb-Lab和TeletechInternational的所有团队,我很享受与他们一起工作和交流的时光;特别感谢Yohann Pansard,Maxime Barreau, Bruno Fernandès, Abderrahim Azmou, Rémy Anceau, Elie Testard,Jean-Michel Barbier, Guillaume Despret, Loïc Lucien, Régis Träger和Kevin Vieille。0我还要感谢Côte d’Or地区的Caisse Primaire d’Assurance Maladie和Caisse Nationaled’Assurance Maladie的同事们,他们让我有足够的时间来完成这篇论文并准备答辩。0我还要感谢Sergey Kirgizov,Armen Petrossian和WahabouAbdou在我的论文中提供的宝贵帮助,以及我们的许多讨论。0我也要热情地感谢Cl´emenceM´enis为校对本文的部分内容,以及我们所有的对话,这些对话深深地丰富了我。0感谢C´ecile Tugler对我的支持,启发和改变了我的生活。0就像没有装订的页面一样,这篇论文和其他很多东西都会在没有Herv´eAbdi的情况下散布开来,我永远不会感谢他们足够,也不会成为今天的我。0最后,我要深深地感谢我的父母,感谢他们的灵感,支持和让我走得更远。ix0目录01 引言 101.1 论文的背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.2 探讨的问题和贡献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301.3 文档组织 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502 背景和问题 702.1 客户关系管理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802.1.1 定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802.1.2 挑战 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1002.2 Web的转变 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1102.2.1 对客户关系管理的影响:社交CRM . . . . . . . . . . . . . . . . . . . . 1202.2.2 客户关系管理工具的演变 . . . . . . . . . . . . . . . . . . . 1202.3 eb-Lab公司介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1402.3.1 企业活动 . . . . . . . . . . . . . . . . . . . . . . . . . 1402.3.2 新的CRM功能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1502.4 问题和方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . 1603 现有技术 2103.1 复杂网络概念 . . . . . . . . . . . . . . . . . . . . . . . . . 2203.1.1 复杂网络的理论模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . 2303.1.2 复杂网络的特征和度量 . . . . . . . . . . . . . . . . . . 2603.2 图论支持 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2803.2.1 结构定义 . . . . . . . . . . . . . . . . . . . . . . . . . 2803.2.2 图的代数方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2803.2.3 运算符 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2903.2.4 图和数据模型:讨论和限制 . . . . . . . . . . . . . . . . . . . . . . 3103.3 社区检测 . . . . . . . . . . . . . . . . . . . . . . . . . . . 3303.3.1 社区概念的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . 3303.3.2 自动分类和聚类 . . . . . . . . . . . . . . . . 3303.3.2.1 分类方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340x 目录03.3.2.2 分类算法 . . . . . . . . . . . . . . 3403.3.2.3 分区质量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3503.3.3 图中社区检测算法 . . 3803.3.4 工具和主要算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4003.3.4.1 图的拓扑结构 . . . . . . . . . . . . . . . . . . . . . 4003.3.4.2 质量函数和优化 . . . . . . . . . . . . . . . . . . . . . 4003.3.4.3 线性代数工具 . . . . . . . . . . . . . . . . . . . 4203.3.4.4 随机游走 . . . . . . . . . . . . . . . . . . . . . . 4203.3.4.5 基于模型的方法 . . . . . . . . . . . . . . 4403.3.5 讨论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4503.4 结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4604 语义社区 4904.1 用户配置建模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5004.2 通用主题配置模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5204.2.1 DisCoCRM架构 . . . . . . . . . . . . . . . . . . . . . . . 5204.2.2 主题配置模型 . . . . . . . . . . . . . . . . . . . . . . . . 5404.2.2.1 基本元素定义 . . . . . . . . . . . . . . 5404.2.2.2 主题配置构建 . . . . . . . . . . . . . . . . . . . . . . 5504.3 社区检测 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5704.4 实验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5804.4.1 用户配置文件构建 . . . . . . . . . . . . . . . . . . . . 5904.4.2 社区检测和实验总结 . . . . . . . . . . . . . . . . . . . 6004.4.2.1 K-Means方法 . . . . . . . . . . . . . . . . . . . . 6004.4.2.2 Louvain方法 . . . . . . . . . . . . . . . . . . . . . . 6204.4.2.3 基于领域知识的Louvain方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6504.4.2.4 实验总结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6804.5 本地社区检测 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6804.5.1 自定义的PageRank算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6804.5.2 实验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7004.5.3 考虑社交网络数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . 7204.6 结论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7405 可扩展平台用于收集、存储和分析来自Twitter的数据 770目录 xi05.1 引言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7805.2 架构描述 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7905.3 数据收集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8005.3.1 Twitter API的类型 . . . . . . . . . . . . . . . . . . . . . . . . . . 8005.3.2 使用Twitter API . . . . . . . . . . . . . . . . . . . . . . . 8105.3.3 Twitter API的限制 . . . . . . . . . . . . . . . . . . . . . . . 8105.4 集群模式和故障恢复机制 . . . . . . . . . . . . . . . . . . . . . . . 8305.5 多语言存储 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8405.6 验证在SNFreezer上的收集和存储 . . . . . . . . . . . . . . . . . . . . 8605.6.1 项目描述 . . . . . . . . . . . . . . . . . . . . . . . . . 8605.6.1.1 Twitter和2014年欧洲选举 . . . . . . . . 8605.6.1.2 2014年世界杯 . . . . . . . . . . . . . . . . . . . 8705.6.1.3 拼车 . . . . . . . . . . . . . . . . . . . . . . . . . . 8705.6.2 集群模式测试以实现采集标准的扩展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8805.6.3 存储扩展和故障恢复 . . . . . . . . . . . . . . . . 8905.7 对SNFreezer分析工具的贡献 . . . . . . . . . . . . . . . . 9005.7.1 探索性事件检测 . . . . . . . . . . . . . . . . . . . 9005.7.1.1 Breakout算法分析 . . . . . . . . . . . . . . 9105.7.1.2 PELT算法分析 . . . . . . . . . . . . . . . . . 9205.7.1.3 基于时间密度的分析 . . . . . . . . . . . . . 9405.7.2 影响力评估 . . . . . . . . . . . . . . . . . . . . . . . . . 9705.7.2.1 中心度度量 . . . . . . . . . . . . . . . . . . . . . 9805.7.2.2 中心节点和权威节点:HITS算法 . . . . . . . . . . . . . . . . . . 10005.7.2.3 TEE 2014项目中的转发图:中心节点和权威节点 . . . . . . . . . . . . . . . . . . .. . . . . . . . . 10105.7.2.4 拼车项目中的中心节点和权威节点 . . . . . . . . . 10105.7.2.5 Twitter账户互动可视化 . . . . . . . . . . . . 10205.7.3 社区检测:hashtag-用户网络 . . . . . . . . . . . . . . . . . . . . 10305.8 SNFreezer与现有平台的比较和结论 . . . . . . . . . . . . . . . 10406 DisCoCRM平台的实施、评估和企业经验 10906.1 介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11006.1.1 项目背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11006.1.2 DisCoCRM项目商业目标 . . . . . . . . . . . . . 1116.6Int´egration des algorithmes et des outils d’analyse . . . . . . . . . . . . . . 1306.7Application Web de contrˆole . . . . . . . . . . . . . . . . . . . . . . . . . . . 1326.7.1Architecture de l’application . . . . . . . . . . . . . . . . . . . . . . . 1326.7.2Base de donn´ees interne . . . . . . . . . . . . . . . . . . . . . . . . 1336.7.3Actions de l’utilisateur et interface de l’application . . . . . . . . . . . 1346.8Bilan et conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1397Conclusion1437.1Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1437.2Perpectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145Annexes1570xii 目录06.1.3 平台功能 . . . . . . . . . . . . . . . . . . . . . . . 11206.2 DisCoCRM平台介绍 . . . . . . . . . . . . . . . . . . . 11406.2.1 平台使用案例 . . . . . . . . . . . . . . . . . . . . 11406.2.2 总体架构 . . . . . . . . . . . . . . . . . . . . . . . . . . . 11506.2.3 与SNFreezer的定位和差异 . . . . . . . 11606.3 项目组织 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11606.3.1 技术环境 . . . . . . . . . . . . . . . . . . . . . . . . 11606.3.2 项目阶段 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11906.4 数据收集工具 . . . . . . . . . . . . . . . . . . . . . . . . . . 12006.4.1 实现采集推文的Web服务 . . . . . . . . . . . . . . . . . . . . . . . . . . . 12006.4.2 内部数据库 . . . . . . . . . . . . . . . . . . . . . . . . 12306.4.3 认证管理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12506.5 数据仓库 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12706.5.1 数据仓库约束 . . . . . . . . . . . . . . . . . . . . . . . . . 12706.5.2 存储系统选择 . . . . . . . . . . . . . . . . . . . . . 12806.5.3 数据仓库设计 . . . . . . . . . . . . . . . . . . . . . . . . . 12806.5.4 数据源架构 . . . . . . . . . . . . . . . . . . . 129TABLE DES FIGURES2.1Offre NestCRM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .153.1Graphe al´eatoire g´en´er´e par le mod`ele Erd¨os R´enyi. . . . . . . . . . . . .243.2R´eseau petit monde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .253.3R´eseau sans ´echelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .253.4Repr´esentation de la fr´equence des liens retweets en fonction du nombrede nœuds (donn´ees issues d’une ´etude eb-Lab sur le co-voiturage). . . .274.1Construction du profil utilisateur sur le site Web d’une entreprise . . . . . .534.2Construction du profil utilisateur sur les r´eseaux sociaux . . . . . . . . . . .544.3Extrait de th´esaurus dans le domaine alimentaire . . . . . . . . . . . . . . .594.4Exemple de repr´esentation des six communaut´es pour le profil explicite . .644.5Extrait du th´esaurus du domaine alimentaire muni d’une distance entre lestags support´ee par la relation hi´erarchique . . . . . . . . . . . . . . . . . . .664.6R´esultats de l’algorithme de d´etection de communaut´e locale centr´ee surl’utilisateur u5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .704.7Distance des nœuds en fonction du rang pour l’utilisateur u1 . . . . . . . . .714.8R´esultats de l’algorithme de d´etection de communaut´e locale centr´ee surl’utilisateur u18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .714.9R´esultats de l’algorithme de d´etection de communaut´e locale centr´ee surl’utilisateur U5 mettant en ´evidence les liens avec les utilisateurs u15 et u13 .724.10 R´esultat de la d´etection de communaut´e locale autour du hashtag deleteuber 734.11 Grandes fonctionnalit´es de la plateforme DisCoCRM . . . . . . . . . . . . .754.12 Gestion des param`etres pour la constitution du profil . . . . . . . . . . . . .755.1Architecture g´en´erale de la plateforme SNFreezer. . . . . . . . . . . . . .805.2Fonctionnement de la Search API de Twitter . . . . . . . . . . . . . . . . . .825.3Fonctionnement de la Streaming API de Twitter . . . . . . . . . . . . . . . .825.4Mod`ele logique de donn´ees relationnelles pour les tweets . . . . . . . . . .855.5Extrait d’un sch´ema de donn´ees sous forme de graphe pour les tweets. .865.6Architecture utilis´ee pour le mode cluster dans le cadre du projet TEE 2014885.7Projet covoiturage - Uber - Algorithme Breakout. . . . . . . . . . . . . . .92xiiixivTABLE DES FIGURES05.8 拼车项目 - Uber - Breakout算法 . . . . . . . . . . . . . . . 9305.9 拼车项目 - Uber - Breakout算法 . . . . . . . . . . . . . . . 9305.10 拼车项目 - Uber - PELT算法 - 平均值 . . . . . . . . . . . . 9405.11 拼车项目 - Uber - PELT算法 - 方差 . . . . . . . . . . . . 9505.12 拼车项目 - Uber - PELT算法 - 平均值和方差 . . . . . 9605.13 基于Twitter数据的事件检测和特征化Web界面概览 (TEE 2014) . . . . . . . . . . 9705.14 特定用户的推文和转推 . . . . . . . . . . . . . . . . 10405.15 特定用户在时间段内的推文,以时间轴形式显示 . . . . . . . . . . . . . . . . . . . . . . . 10505.16 G-OWL本体模式示例[H´eon et al., 2013] . . 10505.17 在TEE 2014法语语料库中检测到的社区和特殊性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . 10606.1 DisCoCRM在Teletech International提供中的总体定位 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . 11206.2 合并用户社交资料 . . . . . . . . . . . . . . . . . . . . 11306.3 将用户配置文件与CRM数据库中的数据匹配 . . 11306.4 DisCoCRM的用例 . . . . . . . . . . . . . . . . . . . . . . . . . 11406.5 DisCoCRM架构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11506.6 WebStreamDataProvider中SignalR的工作原理 . . . . 11906.7 DisCoCRM软件模块和交互 . . . . . . . . . . . . . . . 12006.8 DisCoCRM的WebStreamDataProvider整体架构 . . . . . . . . 12106.9 WebStreamDataProvider模块Connector的架构 . . . . . . . 12206.10 WebStreamDataProvider本地数据库建模 . 12406.11 MongoDB中的数据库和集合 . . . . . . . . . . . . . . . . . . . . 12906.12 脚本与其他模块之间的链接 . . . . . . . . . . . . . . . . . . 13106.13 Web控制应用程序架构 . . . . . . . . . . . . . . . . . 13306.14 管理活动的Web应用程序内部数据库 . 13406.15 管理活动的Web应用程序主页 . . . . . . 13506.16 管理活动的Web应用程序数据可视化页面 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 13606.17 Web应用程序数据收集管理页面 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13706.18 管理活动的Web应用程序的活动管理页面 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 13806.19 Web应用程序数据分析管理的第一个页面 . 1380图表目录 xv06.20 Web应用程序数据分析管理的第二个页面 1394.3Extrait de composantes de profils th´ematiques explicites. . . . . . . . . .614.4Extrait de composantes combinant les composantes explicites et implicitesdans le profil affin´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .614.6Communaut´es extraites `a partir des profils non affin´e et affin´es avec lam´ethode de Louvain . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .634.7Caract´erisation au moyen des tags associ´es aux communaut´es d´etect´eesavec les profils non affin´e et affin´es. . . . . . . . . . . . . . . . . . . . . .634.8Communaut´es obtenues pour les profils explicite, affin´es avec Louvain pi-lot´ee par la connaissance du domaine . . . . . . . . . . . . . . . . . . . . .664.9Caract´erisation par les tags des communaut´es obtenues au moyen desprofils affin´ees et affin´ees avec la m´ethode de Louvain pilot´ee . . . . . . . .675.1Param`etres breakout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .915.2Projet TEE 2014 - Top 10 des hubs et autorit´es (X est utilis´e pour anony-miser des comptes d’utilisateurs autres que des personnages publics oudes comptes des partis ou des personnes officielles des partis) . .
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功