低秩约束下估计匹配亲和矩阵:高维运输问题的新方法

需积分: 9 1 下载量 26 浏览量 更新于2024-07-09 收藏 302KB PDF 举报
本文是一篇关于"估计低秩约束下的匹配亲和矩阵"的研究论文,发表于IZA Discussion Paper Series的第10449号。作者包括Arnaud Dupuy、Alfred Galichon和Yifei Sun。论文探讨的主题是在高维最优运输问题背景下,如何通过熵正则化的方法处理逆问题,即从观测到的联合分布中准确估计匹配亲和度,特别是当数据具有高维度特性时。 在传统的最优运输理论中,亲和矩阵(或匹配亲和力)被分类并用于确定最优化的联合分布,但这种方法在处理实际高维数据时可能面临挑战。论文的核心创新在于提出了一个结合核范数正则化的低秩约束模型,这种方法有效地限制了亲和矩阵的秩,以便更精确地捕捉与匹配关系相关的关键因素。这不仅有助于提高估计的准确性,还能简化复杂性,使之适用于大数据环境。 在解决这个逆问题时,作者们采用了熵正则化技术,这是一种常用的统计学习工具,能够平衡模型的复杂度和拟合能力。这种技术有助于在估计过程中引入稳定性,防止过拟合,并且能够在保持低秩性的同时寻找最优解决方案。这种方法的应用场景可能包括婚姻市场分析、网络社区划分、甚至在机器学习中的推荐系统,其中亲和度或相似度的估计是关键组成部分。 值得注意的是,这篇论文作为初步研究成果,鼓励读者进行讨论。引用时需考虑到其预印本性质,可能存在后续修订版本。IZA Institute of Labor Economics,作为一个独立的经济研究机构,致力于劳动经济学研究,为政策制定者提供基于证据的建议,以应对全球劳动力市场的挑战。 本文对于理解和应用低秩约束下的匹配亲和矩阵估计具有重要意义,特别是在高维数据处理和最优运输问题中,为研究者和实践者提供了新的理论框架和技术手段。