查看“数理统计”的源代码
←
数理统计
跳到导航
跳到搜索
因为以下原因,您没有权限编辑本页:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
==基础知识== *贝叶斯和频率论解释的差异: [http://en.wikipedia.org/wiki/Lindley%27s_paradox Lindley's paradox ] ==Moment-generating function== *定义 :<math> M_X(t) := \mathbb{E}\!\left[e^{tX}\right], \quad t \in \mathbb{R}, </math> *特性:该函数可以找到 all the moments of the distribution. : <math> e^{t\,X} = 1 + t\,X + \frac{t^2\,X^2}{2!} + \frac{t^3\,X^3}{3!} + \cdots +\frac{t^n\,X^n}{n!} + \cdots. </math> Hence: : <math> \begin{align} M_X(t) = \mathbb{E}(e^{t\,X}) &= 1 + t \,\mathbb{E}(X) + \frac{t^2 \,\mathbb{E}(X^2)}{2!} + \frac{t^3\,\mathbb{E}(X^3)}{3!}+\cdots + \frac{t^n\,\mathbb{E}(X^n)}{n!}+\cdots \\ & = 1 + tm_1 + \frac{t^2m_2}{2!} + \frac{t^3m_3}{3!}+\cdots + \frac{t^nm_n}{n!}+\cdots, \end{align} </math> ===中位值和平均值=== *中位值对应的误差mean absolute error function <math>mae(a) = \frac{1}{n - 1} \sum_{i=1}^n |x_i - a|, \quad a \in \R</math> *平均值对应的误差是 mean square error function <math>mse(a) = \frac{1}{n - 1} \sum_{i=1}^n (x_i - a)^2, \quad a \in \R </math> :参考[http://www.math.uah.edu/stat/sample/Variance.html] :中位值的误差 1.253*sigma/sqrt(N),比平均值误差大 (假设高斯分布) ===方差,标准偏差,误差=== *样本方差(sample variance) <math> s^2 = \frac{1}{n - 1} \sum_{i=1}^n (x_i - m)^2 </math> :证明参考:[http://www.math.uah.edu/stat/sample/Variance.html] *样本方差的分布可以用Chi-square分布近似 <math>\dfrac{(n-1)S^2}{\sigma^2}=\dfrac{\sum_{i=1}^n (X_i-\bar{X})^2}{\sigma^2}\sim \chi^2(n-1)</math> :证明参考[https://onlinecourses.science.psu.edu/stat414/node/174] :严格形式[http://mathworld.wolfram.com/SampleVarianceDistribution.html] *标准偏差的误差,0.71**sigma/sqrt(N) (假设高斯分布) ===例子=== *两组数据混合之后的均值和弥散 :数组 A (i=1,N1), 其均值为 M1,弥散为 S1,数组 B(i=1,N2),其均值为M2,弥散为S2,现将A,B混合组成数组C,求其均值M3和弥散S3 M3=(N1*M1+N2*M2)/(N1+N2) (N1+N2)*S3^2=N1*S1^2+N2*S2^2+(N1^2+N2^2)/(N1+N2)^2*(M1-M2)^2 ==极值统计== 极值统计在天文中有较多应用:如观测到的高红移星系团,大的void的是否符合halo mass function的预言? BCG的光度是否符合光度函数的极值分布? *arxiv:1108.1358 给出了halo mass function的极值分布函数的近似,表明要用极值来区分非高斯性是有困难的。 *arxiv:1108.5458 : 在拿观测和理论模型进行比较的时候,可以在两个极端之间 ,1观测样本是极限情况(least probable),2,随机情况。 *在讨论观测样本的可能数目(比如一定体积限内大于多少质量的星系团的个数)之外,还可以进一步比较观测量(比如)的分布情况。 *极值统计的两种近似(arXiv: 1201.3526) :*GEV (general extreme value): Gnedenko approach 比如一个空间内最大质量星系团不超过某个极值的概率 :*The Pareto approach 这是一个条件概率,比如是在大于某个极限的星系团中,超过这个极限某个数值的概率。 :*这两个概率在极限情况下,就是比如星系团的极值都设得特别大的情况下都是1. 但是在非极限情况下不一致,条件概率比GEV更小一点。 ==参考网站== *http://www.math.uah.edu/stat/ *https://onlinecourses.science.psu.edu/stat414/
返回至“
数理统计
”。
导航菜单
个人工具
登录
命名空间
页面
讨论
大陆简体
已展开
已折叠
查看
阅读
查看源代码
查看历史
更多
已展开
已折叠
搜索
导航
首页
社群首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息