请问非参数统计中核密度估计的均方误差和均平方积分误差函数是怎么求出来的？

好的，我们来聊聊非参数统计中核密度估计的均方误差（MSE）和均平方积分误差（MISE）是如何推导出来的。这确实是理解核密度估计性能的关键。

首先，我们要明确一点：在非参数统计中，我们不知道真实的概率密度函数 $f(x)$ 是什么样子。我们的目标是利用观测到的数据样本 $X_1, X_2, dots, X_n$ 来估计它。核密度估计就是一种非常流行的估计方法。

核密度估计的表达式是这样的：

$hat{f}_h(x) = frac{1}{nh} sum_{i=1}^n Kleft(frac{x X_i}{h} ight)$

其中：
$X_1, dots, X_n$ 是从未知密度函数 $f(x)$ 中抽取的大小为 $n$ 的独立同分布（i.i.d.）样本。
$K(cdot)$ 是一个核函数，它需要满足一些性质（例如，非负、积分等于1、关于原点对称等）。常见的核函数有高斯核、Epanechnikov核等。
$h > 0$ 是一个平滑参数（也叫带宽），它决定了估计的平滑程度。

现在，我们来具体分析均方误差（MSE）和均平方积分误差（MISE）。

1. 均方误差 (Mean Squared Error, MSE)

定义：

对于一个估计量 $hat{ heta}$，其均方误差定义为：

$MSE(hat{ heta}) = E[(hat{ heta} heta)^2]$

其中 $ heta$ 是我们想要估计的真实参数值。

在核密度估计的语境下，我们估计的是函数 $hat{f}_h(x)$ 在某个特定点 $x$ 处的值，而真实值为 $f(x)$。所以，在点 $x$ 处的均方误差是：

$MSE(hat{f}_h(x) | x) = E[(hat{f}_h(x) f(x))^2]$

根据期望的性质，我们可以将MSE分解为偏差（Bias）和方差（Variance）两部分：

$MSE(hat{f}_h(x)) = E[(hat{f}_h(x) E[hat{f}_h(x)]) + (E[hat{f}_h(x)] f(x))]^2$
$MSE(hat{f}_h(x)) = E[(hat{f}_h(x) E[hat{f}_h(x)])^2] + E[(E[hat{f}_h(x)] f(x))^2] + 2 E[(hat{f}_h(x) E[hat{f}_h(x)])(E[hat{f}_h(x)] f(x))]$

由于 $E[hat{f}_h(x)]$ 是一个常数，所以最后一项期望为零：

$MSE(hat{f}_h(x)) = Var(hat{f}_h(x)) + (Bias(hat{f}_h(x)))^2$

其中：
偏差 (Bias): $Bias(hat{f}_h(x)) = E[hat{f}_h(x)] f(x)$
方差 (Variance): $Var(hat{f}_h(x)) = E[(hat{f}_h(x) E[hat{f}_h(x)])^2]$

推导偏差和方差：

为了计算偏差和方差，我们需要先计算 $hat{f}_h(x)$ 的期望。

期望 $E[hat{f}_h(x)]$：

$E[hat{f}_h(x)] = Eleft[frac{1}{nh} sum_{i=1}^n Kleft(frac{x X_i}{h} ight) ight]$
由于样本是 i.i.d. 的，所以：
$E[hat{f}_h(x)] = frac{1}{nh} sum_{i=1}^n Eleft[Kleft(frac{x X_i}{h} ight) ight]$
因为 $X_i$ 是从 $f(t)$ 中抽取的，所以 $Eleft[Kleft(frac{x X_i}{h} ight) ight]$ 可以用积分表示：
$Eleft[Kleft(frac{x X_i}{h} ight) ight] = int_{infty}^{infty} Kleft(frac{x t}{h} ight) f(t) dt$

为了计算这个积分，我们做一个变量替换：令 $u = frac{x t}{h}$，那么 $t = x uh$， $dt = h du$。
当 $t o infty$， $u o infty$；当 $t o infty$， $u o infty$。
所以积分变为：
$int_{infty}^{infty} K(u) f(x uh) (h) du = h int_{infty}^{infty} K(u) f(x uh) du$

因此，
$E[hat{f}_h(x)] = frac{1}{nh} sum_{i=1}^n left( h int_{infty}^{infty} K(u) f(x uh) du ight)$
$E[hat{f}_h(x)] = int_{infty}^{infty} K(u) f(x uh) du$

为了进一步分析，我们通常假设核函数 $K$ 是一个非常尖锐的函数（即，随着 $|u|$ 的增大而快速趋向于零），并且 $h$ 是一个小带宽。在这种情况下，我们可以对 $f(xuh)$ 在 $u=0$ 处进行泰勒展开：
$f(x uh) = f(x) uh f'(x) + frac{(uh)^2}{2} f''(x) dots$

然后代入期望的表达式：
$E[hat{f}_h(x)] = int_{infty}^{infty} K(u) left( f(x) uh f'(x) + frac{(uh)^2}{2} f''(x) dots ight) du$
$E[hat{f}_h(x)] = f(x) int K(u) du h f'(x) int u K(u) du + frac{h^2}{2} f''(x) int u^2 K(u) du dots$

根据核函数的性质：
$int K(u) du = 1$
$int u K(u) du = 0$ (对于对称核函数)
$int u^2 K(u) du = mu_2(K)$ (核函数的二阶矩，例如高斯核的二阶矩不是0)

如果我们只考虑前三项并假设 $h$ 很小，那么：
$E[hat{f}_h(x)] approx f(x) cdot 1 h f'(x) cdot 0 + frac{h^2}{2} f''(x) mu_2(K)$
$E[hat{f}_h(x)] approx f(x) + frac{h^2}{2} f''(x) mu_2(K)$

于是，偏差为：
$Bias(hat{f}_h(x)) = E[hat{f}_h(x)] f(x) approx frac{h^2}{2} f''(x) mu_2(K)$
这个偏差的大小与 $h^2$ 成正比，并且与真实密度函数二阶导数有关。

方差 $Var(hat{f}_h(x))$：

$Var(hat{f}_h(x)) = Varleft(frac{1}{nh} sum_{i=1}^n Kleft(frac{x X_i}{h} ight) ight)$
由于样本是 i.i.d. 的，所以方差可以写成：
$Var(hat{f}_h(x)) = frac{1}{(nh)^2} sum_{i=1}^n Varleft(Kleft(frac{x X_i}{h} ight) ight)$
$Var(hat{f}_h(x)) = frac{1}{n^2 h^2} n Varleft(Kleft(frac{x X_1}{h} ight) ight)$
$Var(hat{f}_h(x)) = frac{1}{nh^2} Varleft(Kleft(frac{x X_1}{h} ight) ight)$

$Varleft(Kleft(frac{x X_1}{h} ight) ight) = Eleft[left(Kleft(frac{x X_1}{h} ight) ight)^2 ight] left(Eleft[Kleft(frac{x X_1}{h} ight) ight] ight)^2$

同样，我们计算第一项 $Eleft[left(Kleft(frac{x X_1}{h} ight) ight)^2 ight]$：
$Eleft[left(Kleft(frac{x X_1}{h} ight) ight)^2 ight] = int_{infty}^{infty} left(Kleft(frac{x t}{h} ight) ight)^2 f(t) dt$
变量替换 $u = frac{x t}{h}$， $dt = h du$：
$int_{infty}^{infty} (K(u))^2 f(x uh) (h) du = h int_{infty}^{infty} (K(u))^2 f(x uh) du$

当 $h$ 很小时，我们可以对 $f(xuh)$ 在 $u=0$ 处泰勒展开：
$f(x uh) approx f(x)$ (保留常数项)

那么，
$Eleft[left(Kleft(frac{x X_1}{h} ight) ight)^2 ight] approx h int_{infty}^{infty} (K(u))^2 f(x) du = h f(x) int (K(u))^2 du$

记 $int (K(u))^2 du = R(K)$ (核函数的平方积分)，则
$Eleft[left(Kleft(frac{x X_1}{h} ight) ight)^2 ight] approx h f(x) R(K)$

而第二项 $left(Eleft[Kleft(frac{x X_1}{h} ight) ight] ight)^2 approx left(f(x) + frac{h^2}{2} f''(x) mu_2(K) ight)^2 approx (f(x))^2$ （因为 $h^2$ 的项在高阶近似中可以忽略）。
更精确地，我们使用 $E[hat{f}_h(x)] approx f(x)$ 来简化。

所以，
$Var(hat{f}_h(x)) approx frac{1}{nh^2} (h f(x) R(K) (f(x))^2)$
这里出现了一个问题，当 $f(x)$ 不接近零时，方差的第二项会比第一项大得多。

重新思考方差的近似：

更标准的近似方法是，我们假设 $h o 0$ 同时 $nh o infty$（这是保证估计量一致性的条件）。
在这种情况下，我们计算 $Var(hat{f}_h(x))$ 时，可以近似为：
$Var(hat{f}_h(x)) = frac{1}{nh^2} left( Eleft[ Kleft(frac{x X_1}{h} ight)^2 ight] left( Eleft[ Kleft(frac{x X_1}{h} ight) ight] ight)^2 ight)$
当 $h o 0$ 且 $nh o infty$， $E[K(frac{xX_1}{h})]$ 的形状会越来越接近一个 Dirac delta 函数，所以 $E[K(frac{xX_1}{h})] approx f(x)$。
$E[K(frac{xX_1}{h})^2]$ 的近似是 $h f(x) R(K)$.

因此，方差近似为：
$Var(hat{f}_h(x)) approx frac{1}{nh^2} (h f(x) R(K)) = frac{f(x) R(K)}{nh}$

总结MSE：

将偏差和方差加起来，我们在点 $x$ 处的均方误差近似为：
$MSE(hat{f}_h(x)) approx left(frac{h^2}{2} f''(x) mu_2(K) ight)^2 + frac{f(x) R(K)}{nh}$
$MSE(hat{f}_h(x)) approx frac{h^4}{4} (f''(x))^2 (mu_2(K))^2 + frac{f(x) R(K)}{nh}$

这个公式非常重要，它揭示了带宽 $h$ 的作用：
偏差项（第一项）随着 $h$ 的增大而增大，因为高阶导数项 $f''(x)$ 被乘以了 $h^4$。
方差项（第二项）随着 $h$ 的增大而减小，因为 $h$ 在分母上。

我们通常会选择一个最优的带宽 $h_{opt}$ 来最小化这个 $MSE(hat{f}_h(x))$。

2. 均平方积分误差 (Mean Integrated Squared Error, MISE)

定义：

均平方积分误差是将点估计的均方误差在整个定义域上进行积分：

$MISE(hat{f}_h) = Eleft[int_{infty}^{infty} (hat{f}_h(x) f(x))^2 dx ight]$

由于积分和期望可以交换顺序（Fubini 定理），我们可以写成：

$MISE(hat{f}_h) = int_{infty}^{infty} E[(hat{f}_h(x) f(x))^2] dx$
$MISE(hat{f}_h) = int_{infty}^{infty} MSE(hat{f}_h(x)) dx$

我们已经得到了 $MSE(hat{f}_h(x))$ 的近似表达式：
$MSE(hat{f}_h(x)) approx frac{h^4}{4} (f''(x))^2 (mu_2(K))^2 + frac{f(x) R(K)}{nh}$

所以，将它积分：
$MISE(hat{f}_h) approx int_{infty}^{infty} left( frac{h^4}{4} (f''(x))^2 (mu_2(K))^2 + frac{f(x) R(K)}{nh} ight) dx$
$MISE(hat{f}_h) approx frac{h^4}{4} (mu_2(K))^2 int_{infty}^{infty} (f''(x))^2 dx + frac{R(K)}{nh} int_{infty}^{infty} f(x) dx$

由于 $int_{infty}^{infty} f(x) dx = 1$，所以：
$MISE(hat{f}_h) approx frac{h^4}{4} (mu_2(K))^2 int_{infty}^{infty} (f''(x))^2 dx + frac{R(K)}{nh}$

记：
$I(f'') = int_{infty}^{infty} (f''(x))^2 dx$ (真实密度函数二阶导数的平方积分)
$C_K = mu_2(K)^2$ (与核函数二阶矩相关的常数，例如高斯核 $K(x) = frac{1}{sqrt{2pi}} e^{x^2/2}$， $mu_2(K) = 1$，所以 $C_K = 1$)
$R(K) = int_{infty}^{infty} K(x)^2 dx$ (核函数的平方积分，例如高斯核 $R(K) = frac{1}{2sqrt{pi}}$)

则 MISE 的近似公式为：
$MISE(hat{f}_h) approx frac{h^4}{4} C_K I(f'') + frac{R(K)}{nh}$

推导过程的细节和数学严谨性：

上面的推导都依赖于泰勒展开和一些近似。要得到更精确的结果，需要更细致的数学分析，通常会涉及到：

1. 核函数的性质：核函数 $K(x)$ 需要满足一些条件，例如：
$K(x) ge 0$
$int K(x) dx = 1$
$int x K(x) dx = 0$ (通常要求对称核)
$int x^2 K(x) dx = mu_2(K) < infty$
$K(x) o 0$ as $|x| o infty$

2. 带宽选择的依赖性： MISE 公式显示了 MISE 取决于带宽 $h$ 和真实密度函数 $f(x)$ 的二阶导数 $f''(x)$。由于我们不知道 $f(x)$，也就不知道 $f''(x)$，所以我们无法直接计算出最优的 $h$ 和最小的 MISE。这引出了带宽选择的问题，有很多方法来估计最优带宽，例如交叉验证（Crossvalidation）。

3. 数学推导的严谨性：在实际的统计学文献中，对 $E[hat{f}_h(x)]$ 和 $Var(hat{f}_h(x))$ 的计算会更加严谨。例如，对于 $E[hat{f}_h(x)] f(x)$ 的精确形式，根据积分的定义：
$E[hat{f}_h(x)] f(x) = int K(u) f(xuh) du f(x)$
$= int K(u) f(xuh) du f(x) int K(u) du$
$= int K(u) (f(xuh) f(x)) du$
如果我们假设 $f$ 是二阶可导的，那么 $f(xuh) f(x) = uhf'(x) + frac{(uh)^2}{2}f''(x) O(h^3)$。
代入积分：
$= int K(u) left(uhf'(x) + frac{(uh)^2}{2}f''(x) dots ight) du$
$= h f'(x) int u K(u) du + frac{h^2}{2} f''(x) int u^2 K(u) du dots$
对于对称核，$int u K(u) du = 0$，所以：
$Bias(hat{f}_h(x)) = frac{h^2}{2} f''(x) int u^2 K(u) du + O(h^3)$
这就是我们之前得到的偏差近似。

对于方差的精确计算，会涉及到 $E[K(frac{xX}{h})^2]$ 的计算，其结果会比我们上面简单积分更复杂，但其主导项（即当 $h o 0$ 时）通常会是 $frac{f(x) R(K)}{nh}$。

4. MISE 的渐近性质：上面得到的 MISE 公式是关于带宽 $h$ 的渐近表达式。在很多理论分析中，我们会关注当 $n o infty$ 和 $h o 0$（但 $nh o infty$）时的渐近 MISE (AMISE)。AMISE 公式就是我们上面推导出的 $MISE(hat{f}_h) approx frac{h^4}{4} C_K I(f'') + frac{R(K)}{nh}$。

为什么我们要关心 MSE 和 MISE？

评估估计器的性能： MSE 和 MISE 提供了衡量估计器准确性的标准。它们量化了估计量与真实值之间的平均差异。
优化带宽参数：通过最小化 MSE 或 MISE，我们可以找到最优的带宽 $h$，使得核密度估计在偏差和方差之间达到最佳平衡。
理论分析的基础：这些误差度量是许多非参数统计理论分析的基础，用于证明估计量的一致性、渐近正态性等性质。

总之，核密度估计的均方误差和均平方积分误差是通过计算估计量的期望和方差，然后利用泰勒展开等数学工具近似得到的。它们揭示了带宽参数 $h$ 和真实密度函数 $f(x)$ 的特性对估计性能的影响，并为优化带宽选择提供了理论指导。这个过程涉及到微积分、概率论和统计学的多方面知识。

网友意见

其实就只是用了以及Taylor展开(到2阶)^[1].

设随机变量独立且具有相同的概率密度函数 , 那么处的核密度估计量为 , 其中是人为选定的核函数(概率密度函数), 是调整参数(窗宽), . 考虑和 , 下面（如果觉得等号过不去就对或者加假设）分别算和 .

从而

故

,
再对积分即得

参考

^对于Hölder类/Sobolev类概率密度函数也有类似推广, 与之对应的核函数也需要更高阶; 见Tsybakov的Introduction to Nonparametric Estimation第一章 https://doi.org/10.1007/978-0-387-79052-7_1

类似的话题

请问非参数统计中核密度估计的均方误差和均平方积分误差函数是怎么求出来的？

好的，我们来聊聊非参数统计中核密度估计的均方误差（MSE）和均平方积分误差（MISE）是如何推导出来的。这确实是理解核密度估计性能的关键。首先，我们要明确一点：在非参数统计中，我们不知道真实的概率密度函数 $f(x)$ 是什么样子。我们的目标是利用观测到的数据样本 $X_1, X_2, dots, .............
请问，吕蒙选择夺取荆州，而非徐州，参考吕蒙的谋划，是否合理？

吕蒙夺取荆州，而非徐州，在当时的历史背景下，从军事战略和政治格局上看，是相当合理且具有深谋远虑的选择。这背后并非一时冲动，而是基于对局势的深刻洞察和严密的谋划。首先，我们要明确当时三国鼎立的局面，以及各方势力的大致分布和战略意图。曹魏：占据中原，实力最为雄厚，志在统一天下。其主要威胁方向是南.............
请问这个参数方程是怎么写出来的？

好的，我们来聊聊参数方程是怎么“诞生”的。它不是凭空冒出来的，背后其实是对事物运动或形状的一种“观察”和“描述”方式的深化。想象一下，你站在一个路口，看到一辆自行车从你面前骑过。你如果想准确地描述这辆自行车在任何一个时间点的位置，你会怎么做？你可以说：“在时间 T 的时候，它在马路的左边，离我 5 .............
D20SB80它是用在电磁炉上，好像是桥堆。请问它的参数代换的什么？

.......
请问有哪些网站可以看到耳机准确频响，thd，csd等参数呢？

想找到关于耳机精确频响、THD（总谐波失真）、CSD（累积频谱衰减）等技术参数的网站，这绝对是个技术宅或者追求极致音质烧友们才会深入探讨的问题。要找到真正靠谱、详细的网站，确实需要一些技巧，并且要避开那些为了流量而做的浮夸评测。下面我来跟你好好捋一捋，告诉你从哪里能找到这些宝贝信息，以及怎么看懂它们.............
请问有哪位高手知道烤箱面板cdo-10b的参数使用说明？求解

.......
请问谁有奔腾电磁炉图纸，型号奔腾PC21N-B。或者是R107的参数。谢谢。

.......
请问电磁加热电饭煲要怎么选？主要看哪些参数？急

.......
请问格兰仕微波炉，里面装可调电阻器是一个还是多少个，一搬需要多少W.R的参数？？？？？，谢谢了。

.......
电磁炉上的单相整流桥，请问怎样看D15SB80参数？

.......
请问参加数学建模，打算用python的话，需要完整的学习python所有内容，还是只要学一部分就够了？

参加数学建模，打算用 Python，这绝对是个明智的选择！Python 的强大之处在于它简洁易懂的语法和海量的库，能极大地简化你的建模过程。那么，到底需要学到什么程度呢？我的建议是：不必追求学完 Python 的所有内容，但要学精、学透与数学建模紧密相关的核心知识点。我来详细说说为什么以及具体需要掌.............
请问T-3485是否参加了库尔斯克会战，不是非得量产，哪怕有一辆也算，请问真的参加了吗？

关于T3485坦克是否参加了库尔斯克会战这个问题，答案是：T3485坦克并未正式参加库尔斯克会战。我知道这个问题对于一些军事爱好者来说可能有点令人意外，因为T34系列坦克无疑是二战中最具标志性的坦克之一，而库尔斯克会战又是东线战场规模最宏大、最关键的战役之一。然而，事实就是，当1943年7月库尔斯克.............
现在俄罗斯普京已签署征召外籍人加入俄罗斯军队，请问报名参加俄罗斯外籍军队，如何报名参加，在哪里报名？

如果你想了解如何通过合法途径加入俄罗斯军队，并成为一名外籍雇佣兵，那么你需要了解一些基本流程和可能存在的渠道。首先，俄罗斯在2022年通过了一项法律，允许外国公民通过与俄罗斯国防部签订合同的方式加入其武装部队。这项法律的出现，使得原本就存在的雇佣兵性质的参与，有了一个更加官方和规范的渠道。要报名参加.............
一个分包单位，跟总包签合同，资料没进档案馆，竣工验收没有参加，请问项目能顺利竣工吗？

这情况可不妙，一个小小的分包单位掉链子，很可能让整个项目的竣工验收“卡壳”，甚至延误。咱们就来好好说道说道，为什么会这样，以及可能带来的影响。首先，为什么说“资料没进档案馆，竣工验收没参加”是个大问题？1. 资料是项目合法性的“身份证”：过程资料：施工过程中产生的各种图纸、签证.............
请问野坂参三算不算是日本的汪兆铭？

野坂参三和汪兆铭，这两个名字在中国近现代史的语境中，都承载着复杂的历史评价。将他们进行类比，就像是将两幅截然不同的历史画卷放在一起细看，既有相似之处，又存在着根本的差异。简单地说，野坂参三算不算日本的“汪兆铭”，这个问题不能一概而论，需要深入剖析他们的个人经历、政治立场以及对历史进程的影响。首先，我.............
请问下一战为何美国不参加同盟国这边呢？

你提出的问题非常有意思，但前提有些误解。美国参加了第一次世界大战（以下简称“一战”）的同盟国一方，并且在战争后期起到了至关重要的作用。我猜测你之所以会产生“美国未参加同盟国”的疑问，可能是由于以下几个原因：1. 初期中立态度: 美国在一战爆发初期，确实采取了严格的中立政策，并没有立即加入任何一方。.............
请问中南大学现在能进去参观吗？

想去中南大学逛逛，看看校园风貌？没问题，现在是可以的！不过，想要进校参观，还是得提前了解点门道，这样才能让你这次校园行更顺畅，玩得也更尽兴。总的来说，中南大学对公众是开放的，但并非完全无限制的自由出入。它是一个庞大的教育机构，有自己的管理秩序，所以我们需要配合一下学校的规定。首先，关于“能进去参.............
请问老兵尹吉先有没有参加这次的阅兵呢？

关于尹吉先老兵是否参加了此次阅兵，我这里没有直接的记录显示他本人亲临现场接受检阅。尹吉先老兵，他的人生经历非常丰富，可以说是一位传奇人物。他参加过解放战争、抗美援朝战争，在战场上经历过炮火的洗礼，也为新中国的建立和巩固立下了赫赫战功。他身上承载着那个时代的印记，也代表着一代军人的荣耀与坚韧。像他这样.............
请问听说高中生去日本参加留考虽然题比一般入试简单但容错率低，参加一般入试虽难度大但容错率高，是这样吗?

你好！关于日本留学考试（留考）和一般入试（各大学自主招生考试）的难度与容错率，你的理解有一定道理，但具体情况可能需要更细致地分析。下面我将详细说明，尽量让你对这两个考试有更清晰的认识。首先，我们来理解一下这两个考试的性质和目的：日本留学考试（留考）：英文叫做 Examination for J.............
请问能有资格去报名参加日本修士直考吗？

想去日本读修士（硕士）？直考这条路确实很吸引人，因为相比国内的考研，日本大学院的直考有其独特的优势和流程。那么，究竟什么样的人才能有资格报名参加日本修士直考呢？咱们就掰开了揉碎了，仔细聊聊。首先，最核心的门槛，也是最基本的要求，就是学历背景。1. 国内本科毕业生（或即将毕业生）：拥有.............