2008
年
5
月
第
34
卷第
5
期
北京航空航天大学学报
Journal
of
Beijing University
of
Aeronautics
and
Astronautics
May
2008
Vo
l.
34
No.5
多语互译机译系统统一算法基础一一差异函数
胡明
高庆狮
高小宇
(北京科技大学信息工程学院,北京
100083
)
摘
要:在基于语义语言理论的多语互译机器翻译系统中,为使用同一算法和程序
方便地实现多种自然语言之间的互译,引入了"差异函数该函数可将某语言功能在各种自
然语言表示上的差异隐去,使翻译过程与具体的语言表示无关,从而使系统可以用统一的程序
来处理那些功能相同、但在不同语言上处理方法不同的语言内容.以基数表示功能的处理差异
为例,讨论了差异函数的作用及其在多种语言上的应用.
关
键
词:计算机应用;自然语言处理系统;机器翻译;差异函数
中图分类号:
TP 39
1.
1
文献标识码
:A
文章编号:
1001-5965
(2008
)05-0604-05
United algorithm base of multi-Ianguage machine translation
system : difference function
Hu
Yue
Gao Qingshi Gao Xiaoyu
(Information
Engineering
School
,
University
of
Science
and
Technology
Beijing
,
Beijing
100083
,
China)
Abstract:
In
the
multi-language
machine
translation
system
based
on
semantic
linguistic
theory , in
order
to
realize
the
translation
between
different
natural
languages
with
one
algorithm
and
one
program
,
the
‘ differ-
ence
function'
was
introduced.
The
function
of ‘
difference
function'
is
to
hide
the
representation
differences
among
various
natural
languages
about
a
language
function
, so
that
translation
process
is
independent
of
con-
crete
languages
and
the
multi-language
translation
machine
system
can
easily
deal
with
language
content
with
the
united
algorithm
and
program
,
which
requires
different
treatment
in
different
language.
Taking
the
differ-
ence
of
radix
representation
function
as
an
example
,
the
role of
the
difference
function
and
the
application
of
such
function
in
multi-language
were
discussed.
Key
words:
computer
application;
natural
language
processing
system;
machine
translation;
difference
function
由于自然语言表示的复杂性和多样性,迄今
一般的多语机器翻译系统
[1
-
6J
很难用同一算法和
程序实现多种自然语言间的互译.而基于语义语
言理论
[7
-
9J
的多语互译机译系统能够用同一算法
和程序方便地实现多种自然语言之间的互译,根
本原因是其翻译过程与具体语言的表示无关.
不同的自然语言之所以不同,不仅仅是使用
的符号不同,还在于各种语言功能的表达方式不
同,即同一种语言现象,如时态、语态、否定等在
不同的语言中表示的方式不同.有的使用变词尾、
收稿日期:
2007-12-20
加助词、加前缀、加后缀,有的使用加词、换词等不
同方法或不同组合来表示.在语义语言理论中这
些表示上的不同大多数被纳入到具体的语义单元
的表示不同之中,但是仍然有相当的一部分,像时
态的表示和基数的表示等,超出基本语义单元范
围.例如,汉语基数以万为单位,英语以千为单位,
这些表示是因具体自然语言而异的,难于纳入基
本语义单元,如不采取措施解决此类问题,多语机
译系统难以用统一的算法和程序对这部分语言现
象进行翻译.
基金项目:国家
863
计划资助项目
(2006AAOIZ140
;2006AAOI0I01)
;国家自然科学基金资助项目
(60736014
)
作者简介:胡
现(1
963
- )
,女,北京人,副教授,
huhuyue_OOl
@
sina.
com.