局部贪婪扩展算法在家庭群体识别中的应用

需积分: 0 0 下载量 102 浏览量 更新于2024-09-08 收藏 1.41MB PDF 举报
"这篇论文研究了在电信大数据背景下,如何有效地识别家庭群体,特别是面对赋权的超大规模复杂网络中的重叠社团发现问题。提出了基于核心边的局部贪婪扩展(CEBLGE)算法,该算法以核心边为起点,通过赋权的适应度函数进行两阶段扩展,旨在提高社团划分的质量。同时,它还引入了边权相似度和赋权重叠模块性的概念,优化了对过度相似社团的处理,避免了畸形扩展。在实际应用中,该算法结合中国移动的电信大数据,利用逻辑回归建立了手机用户间家庭成员关系模型,对家庭群体进行了识别,并通过测试数据和营销活动验证了其有效性。" 本文的主要研究内容集中在以下几个关键知识点: 1. **家庭群体识别**:电信运营商需要针对家庭群体进行精准营销,因此准确识别家庭成员之间的关系至关重要。论文利用电信大数据和逻辑回归算法,构建了一个模型来确定手机用户之间的家庭关系。 2. **赋权复杂网络**:网络中的节点和边被赋予不同的权重,这在电信网络中是常见的,因为不同的通信行为和交互具有不同的意义。在这样的网络中寻找社团结构是一项挑战。 3. **重叠社团发现**:传统社团发现往往假设社团之间不重叠,但实际情况中用户可能属于多个社群。CEBLGE算法解决了这个问题,允许社团有交集,提高了识别的准确性。 4. **基于核心边的局部贪婪扩展(CEBLGE)算法**:这是一种新颖的算法,它首先选取核心边作为社团种子,然后通过适应度函数进行扩展,确保社团的稳定性和质量。两阶段扩展策略防止了不合理的扩张,而边权相似度和赋权重叠模块性的考虑进一步优化了社团划分。 5. **边权相似度**:论文定义了衡量边在社团内重要性的度量,有助于评估边在形成社团结构中的贡献。 6. **赋权重叠模块性**:这是评估社团划分质量的一个指标,考虑到边权重,更好地捕捉了网络中节点间的重叠关系。 7. **逻辑回归**:作为统计建模工具,逻辑回归用于构建手机用户间家庭成员关系模型,通过分析用户行为数据预测他们是否为家庭成员。 8. **实证分析**:通过中国移动的实际大数据和营销活动,论文对提出的模型和算法进行了验证,证明了它们在实际场景中的可行性和效果。 这篇研究对于理解并处理大型复杂网络中的社团结构,特别是在电信领域的应用,提供了重要的理论和方法支持。同时,它也为其他领域如社交网络分析、市场细分等提供了参考。