一种多策略结合的地址匹配算法
针对现有的地址匹配算法地址要素切分存在歧义、匹配率和准确率低等问题,提出一种多策略结合的地址匹配算法。利用双向最大匹配分词算法提取有歧义的地址要素,通过建立地址要素特征字词典与地址标准数据库,对歧义结果进行首次歧义消除,再利用基于序列标注的中文分词进行二次歧义消除,将得到的各地址要素匹配数据库后计算相似性匹配得分,最后按照各地址要素的重要程度分配权重,加权求和后得到匹配总得分。结果表明,该算法优于其他传统的地址匹配算法,提高了地址匹配的匹配率与准确率。