最近邻回归估计的随机加权逼近
Ξ
最近邻回归估计的随机加权逼近
王炳章
()烟台大学
摘 要
研究了一种最近邻回归估计的分布逼近问题. 利用随机加权法, 给出了最近
邻回归估计误差的逼近分布及其逼近的精度, 从而改进了文献1 的结论.
关键词 随机加权, 最近邻估计, 回归函数.
()() 分类号 中图212; M R G
1 引言
() ()设 X , Y 为 d × 1 维随机向量, X 的边缘分布为 v , Y 关于X 的条件分布为 F y x . 若 |
E | Y | < ?, 则 Y 关于 X 的回归函数为d() () () r x = E Y |X = x , x ? R . 1d () () () () 设 X , Y , , X , Y 是X , Y 的一组容量为n 的样本, 对固定的 x ?R , 将X , Y , , 1 1 n n 1 1
() X , Y 按照n n
()‖X - x ‖ ? ‖X - x ‖ ? ? ‖X - x ‖ 2 R R R 2 n 1 d . 上式中, 符号 ‖X X - x 在R 中 的次序重排, 并依自然顺序消除“结”- x ‖ 表示向量 R R i i 的欧氏模. 设 k 为一串正整数列, 且n
)()(k ƒn 0, k ƒlnn ?, n ? ?. 3n n
() 利用数列 k 我们可给出回归函数 r x 的一种最近邻估计如下:n
k n1 () ()rn x = Y R . 4i?k n i= 1
() 本文讨论估计量 rx 的误差分布的逼近问题, 所得的结果可用于对回归函数进行区n
间估计和假设检验.
2 主要结果
首先我们给出回归函数估计误差的随机加权统计量k n { 2]Γ,i ()()5 H= [ Y - rx R n n ?i i= 1 其中 Γ, Γ, , Γ1 2 k 为独立同分布, 其分布密度为n 23 - 2x () () () 2x eI x > 0, Θx = ()# 4
3 3 3 () () () (且与样本 X , Y , , X , Y 相互独立. 以下用 P , E , V a r分别表示 X , Y , , X ,1 1 n n 1 1 n
) Y 给定之下的条件概率、条件期望、条件方差. 经计算n k n3 22{ () () ()> V a rH x ]. 6 Hn n [ Y - r= R n ?i i= 1{ () () 我们用 H n Hn 在X 1 , Y 1 , , X n , Y n 给定下的条件分布ƒ 33{ () y > P ()n F {H H? y } 7ƒn n () () 模拟 rx - r x 的分布. 记n ( () () ) k rx - r x n n ()? y , 8 () F y > Pn
D ox
2 () ) (其中D > V a r{Y |X = x } = E { Y - r x |X = x }.ox
3 () () 为便于精确讨论 F y 与 F y 之间的逼近程度, 我们需对模型作如下规定: n n
2 d ( ) () () ) (ir x 及 q x > E Y |X =
最近邻回归估计随机加权逼近 来自淘豆网m.daumloan.com转载请标明出处.