第一章 简介
献和 [18] 第七章. 这些文献主要假设模型是参数回归模型 (包括最特殊的正态分
布) 和非参数回归模型 ([17, 19]). 而对于一些半参数模型, 比如局部线性回归模
型 (partial linear model), 单指数模型 (single index model) 等, 文献中也有很多讨论,
参见 [13, 15, 20]. 其他文献请参考上述文献和 [6] 的第 4.2 节. 这些建立于经典框
架下检验 ([3] 等) 的方法主要包括这么几类: 基于核函数的方法 ([17] 等), 基于经
验过程的方法 ([19]) 和基于经验似然的方法 ([13] 等) 等. 在我的毕业论文里, 我
主要将我们的方法和 Zheng (2009) [17] 基于核函数的方法进行细致的比较.
假设我们从回归模型 (1.1) 中获取了一组随机样本
{
(Y
i
,X
i
)
}
n
i=1
.
Zheng 在 2009 年, 见 [17], 提出了一种基于核函数的检验统计量
T
Z
=
∑∑
i= j
K((X
i
−X
j
)/h)
ˆ
U
i
ˆ
U
j
∑∑
i= j
2K
2
((X
i
−X
j
)/h)
ˆ
U
2
i
ˆ
U
2
j
1/2
, (1.2)
其中 K(·) 是一个核密度函数, h 表示带宽,
ˆ
U
i
=
ˆ
ε
2
i
−
ˆ
σ
2
,
ˆ
ε
i
= Y
i
−g(X
i
;
ˆ
θ
n
),
ˆ
σ
2
=
1/n
∑
n
i=1
ˆ
ε
2
i
表示回归模型 (1.1) 的残差, 这里
ˆ
θ
n
是
θ
的一个
√
n-相合的估计.
Zheng 在一些正则条件下证明了, 他的检验的渐进零分布是标准正态分布, 对于
所有全局备择假设 (global alternatives) 是相合的, 并且在一列以一个慢于 n
−1/2
的
速率 (具体来说是 n
−1/2
h
−d/4
) 收敛到零假设的备择假设 (local alternatives) 下具
有非平凡的势 (non-trivial power).
这篇文章的启发点是来自 Shao 与 Zhang 于 2014 年提出的针对两个变量条
件一阶距 (不) 相关 (conditional mean (in)dependence) 的一种度量, 参见 [10]. Shao
与 Zhang 称其为 martingale difference divergence/correlation (MDD/MDC), 我在我
的毕业论文里称其为鞅差相关度和鞅差相关系数. Shao 与 Zhang 在 2014 年的论
文里使用这种度量来进行高维的变量筛选 (high-dimensional variable screening).
而他们的想法又借鉴了 Sźekely, Rizzo 与 Bahirov 在 2007 年的一篇论文, [11], 这
篇论文考虑了两个变量之间的独立性检验. 我将在下一章里展开论述.
在我的论文里, 我将按照如下章节进行论述. 在第二章简单介绍 Sźekely,
Rizzo 与 Bahirov 在 2007 年提出的距离协方差 (Distance covariance) 和 Shao 与
Zhang 在 2014 年提出的 MDD/MDC. 在第三章中我将介绍我们的基于 MDD/MDC
的检验统计量, 并给出我们的检验的渐进零分布和其在备择假设下的一些统计性
质. 第四章首先考虑了实际数据检验时对零分布的近似, 随后给出了我们的方法
和 Zheng 在 2009 年的方法 ([17]) 的在参数回归模型下的一些模拟比较. 在第五
2
万方数据