Joumal of Computer Applications
计算机应用,
2014
,
34(7):
1988
-1991
ISSN 1001-9081
CODEN JYIIDU
2014-07-10
http://
阴阳.
)oca. cn
文章编号
:1001-9081(2014)07-1988-04
doi: 10.
11772/j.
issn. 1001-908
1.
2014. 07. 1988
亲属关系网络的关系追溯算法
郭瑞强,闰绍惠,赵书良,中玉凤
o
可北师范大学数学与信息科学学院,石家庄
050024)
(
*通信作者电子邮箱
yanhuishaol23@
163.
com)
摘
要:人与人之间通过婚姻关系和亲子关系构成了亲属关系网络。针对亲属关系网络庞大、难以追溯等问题,
结合广度优先搜索策略,提出了两种亲属关系追溯算法:半径搜索和定向搜索。依托河北省会员人口数据库,将数据
范围扩展到复杂网络的层次,以市级亲属关系数据为例构建亲属关系网络,包含约
415
万个节点,约
1088
万条边。采
用双向亲属关系存储,避免了亲属关系回溯查询等问题。实验结果表明关系追溯算法能够准确定位特定关系亲属,
同时具有较高的执行效率和较好的灵活性。
关键词:亲属关系网络;基本亲属关系;复杂亲属关系;关系追溯;亲属关系路径
中图分类号:
T
P3
91
文献标志码
:A
Relationships retrospect algorithm on kinship network
GUO
Ruiqiang
,
YAN
Shaohuγ
,
ZHAO
Shuliang
,
SHEN
Yufeng
(
College
of
M
,
ω
heTTULt
Îcs
and
lr
沪
rmation
Scie
阳
,
Hebei
Normal
University
,
Shiji
αzhua
π
:g
Hebei
050024
, China)
Abstract:
Kinship network is made up of marriage and parent-child relationship. Searching a special relationship
on
a
huge kinship network is very
difficult.
咀】
is
paper proposed
two
algorithms by extending breadth-first-search method: radius-
search and
direction
aI
-search.
币
le
data of the kinship network was extracted from Hebei province population database, which
included about
4150
000 vertexes, and about 10 880 000 edges. The network stored bilateral relationships, which declined
some unnecessary back tracking. The experimental results show that the kinship retrospect algorithm can exactly locate some
specific persons by the network. At
ilie
s
缸
ne
time the algorithms can achieve high penormance and guarantee high flexibility.
Key
words:
kinship network; elementary kinship; complex
kinship;
而
lationships
retrospect; kinship path
0
引言
亲属关系网络将亲属关系研究范围上升到复杂网络
[1
叫
的层次表示。亲属关系是由亲子关系和婚姻关系组成的。亲
属关系网络的形成来自这两类亲属关系之间的相互作用。传
统的亲属关系网络表示形式为混合图。亲属关系网络的具体
构成要素包括亲代与孩子之间的亲子关系形成的单向弧和配
偶之间通过婚姻关系形成的边。传统亲属关系网络的表示形
式主要包括三种[町,分别是
Ore-graph
、
P-graph
和
Bipartite
P-graph
o
Ore-graph
中将个体描述为一个顶点,顶点之间通过
婚姻关系和亲子关系连接。婚姻关系用边描述;亲子关系用
单向弧描述,并由每一个双亲顶点分别指向他们的孩子顶点。
目前,大部分亲属关系网络的研究都采用这种方式。
P-graph
中的顶点描述单个个体或夫妻。未婚个体本身用一个顶点描
述,已婚个体和他(她)的配偶共同用一个顶点描述。在
P-graph
中只存在由孩子顶点指向双亲顶点的单向弧。
P-graph
是元环图,它忽略了个体之间的婚姻关系,因此,也经
常被用于描述家谱图。
Bipartite
P-graph
包含两类顶点,一类
描述夫妻共同顶点,一类描述个体顶点。因此,每一个已婚个
体都有两种类型描述。在
Bipartite
P-graph
中的关系链也是
从孩子顶点指向双亲顶点。
亲属关系网络理论的研究不仅是普遍网络理论方法在一
个特殊社会领域的具体化,也是社会网络本身的一个具体分
支[刑。目前,亲属关系网络的理论研究主要是关于网络中是
否存在婚姻环路的分析。
Hamberger[7]
和
White
等
[S]
提出了
基于网络的亲属关系分析方法,将图论中的概念应用于亲属
关系网络分析。利用深度优先和线性分解的方法分析亲属关
系网络中的婚姻环路,结合实际情况分析产生特殊婚姻现象
的原因。除了亲代与孩子之间的弧和这两个亲代之间婚姻关
系形成的边,组成平凡三元组外,亲属关系网络中存在非常少
的环。
Hamberger[9]
在亲属关系网络上描述了一系列方法用
于研究婚姻环路来分析亲属关系网络的形态学。大量亲属关
系数据也被应用到基因遗传、疾病传播和财产分配等有关的
社会现象中[
10-11]
。
在人口管理领域,对于亲属关系的追溯问题还未涉及。
本文以河北省全员人口数据库中的人口数据为基础,抽取市
级人口数据构建亲属关系网络为研究对象。在亲属关系网络
上实现亲属关系追溯算法,包括半径搜索算法和定向搜索算
法。在网络中抽取任意真实数据进行实验分析。
本文使用
P
司
ek[
叫软件进行实验分析。
Pajek
是一款开
收稿日期
:2014-01
-
13
;修回日期
:2014-02-26
。
基金项目:国家自然科学基金资助项目
(71271067)
;河北省教育厅自然科学研究项目
(QN20131141)
;河北师范大学应用开发基金资助项目(口
012KOl
)。
作者简介:郭瑞强(1
974
-),男,河北石家庄人,副教授,博士,
CCF
会员,主要研究方向:数据挖掘、
Web
智能系统;
同绍惠
(1988
-
),女,河北承德
人,硕士,主要研究方向:数据挖掘、复杂网络;
赵书良(1
967
-)
,男,河北石家庄人,教授,博士,主要研究方向:智能信息处理;
申玉凤(1
987
-),女,河
北石家庄人,硕士,主要研究方向:数据挖掘。