几道题

写在前面

一些注意事项.

题目解答

2022 秋

image-20230621230453397

A={}B={},则

P(A)=(21)7+164=1564,P(AB)=(21)3+164=764,

所以

P(B|A)=P(AB)P(A)=715.

image-20230621232224247

image-20230622130858823

image-20230622135533358

根据熵的定义

H(X)=Rf(x)lnf(x) dx

X 服从参数为 λ 的指数分布,即

f(x)=λeλxI(0,+)(x),

H(X)=0+λeλxln(λeλx) dx=0+λeλx(lnλλx) dx=λlnλ0+eλx dx+λ20+xeλx dx=λlnλeλxλ|0++λ21λ(xeλx|0+0eλx dx)=λlnλ(01λ)λ(00(01λ))=lnλ+1.

image-20230622143616544

XP(λ),则 E(X)=λ=3Var(X)=λ=3.

Z=XY,则

E(Z)=E(XY)=E(X)E(Y)=0,Var(Z)=Var(XY)=Var(X)+Var(Y)=4,

其中方差的运算用到了 X,Y 相互独立这一条件. 由切比雪夫不等式,

P(|ZE(Z)|ε)=Var(Z)ε2,P(|XY|ε)=4ε2.

ε=3,解得

P(|XY|3)=49,P(|XY|<3)=59,P(X3<Y<X+3)=59.

image-20230622151002587

image-20230622153214379

由定义,A 正确;p 值的定义与检验水平 α 无关,B 错误;p 值与原假设 H0 有关,C 错误;

D 还不确定.

image-20230622154259524

这是单个正态总体均值在方差已知情形下的第三个问题的检验.

|Z|=n|Xμ0|σ=2|Xμ0|>uα/2

时拒绝原假设,即临界值为 c=uα/2/2=u0.025/2=1.96/2=0.98.

image-20230622155034359

这是理论分布已知但含有有限个(r=1 个,p) 未知参数的拟合优度检验问题,取值有 k=3 个,则所求自由度为 kr1=1.

image-20230622155302168

image-20230622155439309

(1)

f(x,y)=2IG(x,y),

其中区域 G={(x,y)|0<x<y<1}.

(2)

UU(0,1),则其概率密度函数为

gU(u)=110I(0,1)(u)=I(0,1)(u).

分布函数为

GU(u)={0,u0,u,0<u<1,1,u1.

同理,

gV(v)=I(0,1)(v),GV(v)={0,v0,v,0<v<1,1,v1.

W1=max{U,V} 的分布函数为

Fmax(w)=GU(w)GV(w)=GU2(w),

从而其概率密度函数为

fmax(w)=2GU(w)gU(w)=2wI(0,1)(w).

Y 的概率密度函数为

f2(y)=Rf(x,y) dx=0y2 dx=2y,0<y<1,

f2(y)=2yI(0,1)(y).

W2=min{U,V} 的分布函数为

Fmin(w)=1(1GU(w))(1GV(w))=1(1GU(w))2,

从而其概率密度函数为

fmin(w)=2(1GU(w))gU(w)=2(1w)I(0,1)(w).

X 的概率密度函数为

f1(x)=Rf(x,y) dy=x12 dy=2(1x),0<x<1,

f1(x)=2(1x)I(0,1)(x).

证毕.

(3)

fY|X(y|x)=f(x,y)f1(x)=11xI(x,1)(y),

YX=x 的条件下服从 (x,1) 上的均匀分布.

(4)

f1(x)=2(1x)I(0,1)(x),f2(y)=2yI(0,1)(y)

计算得

E(X)=01xf1(x) dx=012x(1x) dx=13,E(Y)=01yf2(y) dy=012y2 dy=23.
E(X2)=01x2f1(x) dx=012x2(1x) dx=16,E(Y2)=01yf2(y) dy=012y3 dy=12.
Var(X)=E(X2)(E(X))2=118,Var(Y)=E(Y2)(E(Y))2=118.

Z=XY,得

FZ(z)=xyzf(x,y) dxdy=yz/xf(x,y) dxdy=2|D|,

其中 D 是被 y=xx=0y=1y=z/x 围起来的区域,0<z<1. 计算得

FZ(z)=z(1lnz),0<z<1,fZ(z)=lnz,0<z<1.

期望

E(Z)=01zdFZ(z)=zFz(z)|0101Fz(z) dz=1201z dFZ(z),
E(Z)=01zdFZ(z)=14.

补充:这里应当直接考虑随机向量函数的期望进行计算:

E(XY)=Gxyf(x,y) dxdy=201dy0yxy dx=14.

所以,

ρXY=Cov(X,Y)Var(X)Var(Y)=E(XY)E(X)E(Y)Var(X)Var(Y)=1/41/3×2/31/18=12.

image-20230622173447518

(1)

FUi(x)=x,0x1.
P(Mx|Y=n)=(FUi(x))n=xn.

(2)

由全概率公式,x[0,1]

P(Mx)=n=1P(Mx|Y=n)P(Y=n)=n=1xn(e1)n!=1e1(n=0xnn!1)=ex1e1.

求导得

fM(x)=exe1I(0,1)(x).

(3)

不会.

image-20230622175456195

(1)

f1(x)=12πσe(xμ)22σ2,f2(y)=12πσe(xμ)24σ2.

似然函数

L=i=1mf1(xi)j=1nf2(yj)=1(2π)m(4π)nσm+nexp{12σ2i=1m(xiμ)214σ2j=1n(yjμ)2}=12m/2+nπ(m+n)/2σm+nexp{14σ2(2i=1m(xiμ)2+j=1n(yjμ)2)},
=lnL=lnσ(m+n)14σ2(2i=1m(xiμ)2+j=1n(yjμ)2)+=m+n2lnσ214σ2(2i=1m(xiμ)2+j=1n(yjμ)2)+.
σ2=m+n2σ2+14(σ2)2(2i=1m(xiμ)2+j=1n(yjμ)2)=0,

解得

σ^2=12(m+n)(2i=1m(Xiμ)2+j=1n(Yjμ)2).

(2)

σ^2(X1,,Xm,Y1,,Yn)=1m+ni=1m(Xiμ)2+12(m+n)j=1n(Yjμ)2,
E(σ^2)=1m+nσ2E(i=1m(Xiμσ)2)+12(m+n)2σ2E(j=1n(Yjμ2σ)2)=σ2m+nm+σ2(m+n)n=σ2,

从而是无偏估计.

(3)

T=(m+n)σ^2σ2=i=1m(Xiμσ)2+j=1n(Yjμ2σ)2χm+n2.

解不等式

χm+n2(1α/2)(m+n)σ^2σ2χm+n2(α/2)

σ2[(m+n)σ^2χm+n2(α/2),(m+n)σ^2χm+n2(1α/2)]=[(m+n)σ^2χm+n2(0.025),(m+n)σ^2χm+n2(0.975)].

image-20230623162226789

计算:记男性样本 X=(X1,X2,,Xm),女性样本 Y=(Y1,Y2,,Yn)m=13,n=10,则 x=14.95,sX2=6.852;y=22.29,sY2=5.322,则

sT2=(m1)sX2+(n1)sY2m+n2=12×6.852+9×5.32221=6.242.

(1)

这是两个正态总体方差比的检验,检验问题为

H0:σX2/σY2=1H1:σX2/σY21.

检验统计量为

F=SX2SY2,

其观测值为 f=sX2/sY2=6.852/5.322=1.65.

临界值分别为 Fm1.n1(1α/2)=F12,9(0.975)=(F9,12(0.025))1=1/3.87=0.26Fm1,n1(α/2)=F12,9(0.025)=3.44.

由于 0.261.653.44,接受 H0,即可以认为体脂率的方差没有性别差异.

(2)

这是两个正态总体均值差的成组比较,检验问题为

H0:μXμY0H1:μXμY<0.

由于方差未知,取检验统计量

T=mnm+nXYST,

其观测值为

t=mnm+nxysT=13×1013+1014.9522.296.24=2.83,

临界值为 tm+n2(α)=t21(0.05)=1.72.

由于 2.83<1.72,拒绝 H0​,即可以认为成年女性体脂率显著大于成年男性体脂率.

2022 春

image-20230623172816201

A={ 1 }B={ n  k },则

P(AB)=12(n1k1)(12)k1(12)nk=(n1k1)2n,P(B)=(nk)(12)k(12)nk=(nk)2n,
P(A|B)=P(AB)P(B)=(n1k1)(nk)=kn.

这相当于是抛掷硬币 n 次后有 k 次为正面、nk 次为反面,现从这 n 个结果中任选一个,求结果是正面的概率,那就是 k/n. 这个结果应当是与抛掷硬币出现正面的概率无关的.

image-20230623174456181

image-20230623181304654

Z=X2+Y2,则

FZ(z)=P(Zz)=P(X2+Y2z2)=x2+y2z2f(x,y) dxdy=x2+y2z2φ(x)φ(y) dxdy=12πx2+y2z2e(x2+y2)/2 dxdy=12π0rz0θ2πer2/2r drdθ=12π02πdθ0zd(er2/2)=12π2π(ez2/21)=1ez2/2,0z<+.

期望为

E(Z)=0+z dFZ(z)=0+z2ez2/2 dz=0+z d(ez2/2)=(zez2/2|0+0+ez2/2 dz)=0+ez2/2 dz=12+ez2/2 dz=122π+12πez2/2 dz=2π2.

利用随机向量函数的期望直接求解:

E(X2+Y2)=R2x2+y2f(x,y) dxdy=R2x2+y2φ(x)φ(y) dxdy=12πR2x2+y2e(x2+y2)/2 dxdy=12π02πdθ0+rer2/2r dr=12π2π0+r2er2/2 dr=Γ((2+1)/2)2(1/2)(2+1)/2=2Γ(1+1/2)=212π=2π2.

注:这里用到了

 

image-20230623182852004

由全期望公式(平滑公式)得

E(E(X|Y))=E(g(Y))=E(Y2)=E(X).

又因为 E(Y)=2,Var(Y)=2,得

E(X)=E(Y2)=Var(Y)+(E(Y))2=6.

image-20230623183113052

BQ=x,0xBC,事件 Y={线 PQ  AB },则

P(Y|X=x)=SABQSABC=xBC,

X 服从 (0,BC) 上的均匀分布,即

P(X=x)=1BC.

所以由全概率公式,

P(Y)=xP(Y|X=x)P(X=x)=xxBC2=0BCxBC2 dx=12.

image-20230623201200391

易知 X+Y,XYN(0,2),从而

X+Y2,XY2N(0,1),

从而

(X+Y2)2/1(XY2)2/1=(X+Y)2(XY)2F1,1.

image-20230623201607516

image-20230624145904936

(1)

f1(x)=110I(0,1)(x)=I(0,1)(x);

YExp(λ),E(Y)=λ1=2,从而 λ=1/2.

f2(y)=λeλyI(0,+)(y)=ey/2/2I(0,+)(y).
f(x,y)=f1(x)f2(y)=12ey/2IG(x,y),

区域 G={(x,y)|0<x<1,y>0}.

(2)

Z=g(X,Y)=X+Y.

z1 时,Z 的分布函数为

FZ(z)=P(Zz)=P(X+Yz)=x+yzf(x,y) dxdy=01dx0zx12ey/2 dy=12012(1e(zx)/2) dx=01(1e(zx)/2) dx=12(e(z1)/2ez/2),1z<+.

Z 的概率密度函数为

p(z)=ddzFz(z)=(e1)ez/2I[1,+)(z).

0<z<1 时,Z 的分布函数为

FZ(z)=P(Zz)=P(X+Yz)=x+yzf(x,y) dxdy=0zdx0zx12ey/2 dy=120z2(1e(zx)/2) dx=0z(1e(zx)/2) dx=z+2ez/22,0<z<1.

Z 的概率密度函数为

p(z)=ddzFz(z)=(1ez/2)I(0,1)(z).

综上,Z 的概率密度函数为

p(z)=(1ez/2)I(0,1)(z)+(e1)ez/2I[1,+)(z).

(3)

判别式 Δ=(2X)24Y=4(X2Y)0YX2,即求 P(YX2).

P(YX2)=yx2f(x,y) dxdy=1201dx0x212ey/2 dy=101ex2/2 dx=12π01φ(x) dx=12π(Φ(1)Φ(0))12.5066(0.84130.5)0.144.

image-20230624154249409

(1)

α1=E(X)=c+xf(x) dx=c+αcαxα dx=αcαc+dxxα=αcα(α1)11xα1|c+=αc/(α1).
α2=E(X2)=c+x2f(x) dx=c+αcαxα1 dx=αcαc+dxxα1=αcα(α2)1xα2|c+=αc2/(α2).
μ2=Var(X)=E(X2)(E(X))2=α2α12=αc2(α2)(α1)2.

X 代替 α1S2 代替 μ2,得

α^1=1+X2/S2+1,c^1=α^1α^X=X2/S2+11+X2/S2+1X.

(2)

似然函数

L=i=1nf(xi)=αncαni=1nxiα+1,

因为 cx1,x2,,xn,所以 cmin{x1,x2,,xi},因而 c 的最大似然估计 c^2=min{X1,X2,,Xn}=X(1).

对数似然函数

(α,c)=lnL=lnαn+lncαni=1nlnxiα+1=n(lnα+αlnc)(α+1)i=1nlnxi,α=n(α1+lnc)i=1nlnxi=0α^2=11ni=1nlnXilnc^2=ni=1nln(XiX(1)).

(3)

X 的分布函数为

F(x)=cxf(t) dt=1(cx)α,xc.

c^2=X(1)=min{X1,X2,,Xn} 的分布函数为

Fmin(z)=1(1F(z))n=1(cz)nα,zc;

期望为

E(c^2)=c+z dFmin(z)=nαcnαc+dzznα=cnα/(nα1)c,

修正值为

c^2=(nα1)nαX(1).

image-20230624165733934

两个正态总体均值差的成对比较.

构造虚拟总体 Z=XYN(μ,σ2).

序号12345678
早上(xi)172168180181160163165177
晚上(yi)172167177179159161166175
(zi=xiyi)013212-12

样本量 n=8,z=1.25,sZ2=1.282.

检验问题:H0:μ0H1:μ>0.

检验统计量

T=n(Z0)SZ,

则该检验问题的一个水平 α 的检验为:当 T>tn1(α) 时拒绝 H0,否则不能拒绝 H0.

T 的观测值为 t=nz/sZ=8×1.25/1.28=2.76,临界值为 tn1(α)=t7(0.05)=1.895,因为 2.76=t>tn1(α)=1.895,所以拒绝 H0,即可以认为成人早晨的身高显著高于晚上的身高.

其他

3

fY(y)=Rf(x,y) dx=12πRex2+xyy2/2 dx=12πRe(xy/2)2y2/4 dx=12πey2/4Re(xy/2)2 dx=u=xy/212πey2/4+eu2 du=12πey2/4π=12πey2/4.

1

A={ 2 },取划分 B={}B={},则

P(B)=710,P(B)=310,P(A|B)=(62)(92)=512,P(A|B)=(72)(92)=712.

由贝叶斯公式,

P(B|A)=P(AB)P(A)=P(A|B)P(B)P(A|B)P(B)+P(A|B)P(B)=38.

2

X1+Xn2X=σ(X1μσ+Xnμσ2Xμσ).

Yi=XiμσN(0,1),i=1,2,,n,

Y=1ni=1nYi=XμσN(0,1n).

从而,

X1+Xn2X=σ(Y1+Yn2Y),
(X1+Xn2X)2=σ2(Y1+Yn2Y)2=σ2(Y12+Yn2+4Y2+2Y1Yn4Y1Y4YnY),E(X1+Xn2X)2=σ2E(Y12+Yn2+4Y2+2Y1Yn4Y1Y4YnY)=σ2(E(Y12+Yn2)+4E(Y2)+2E(Y1Yn)4E(Y1Y)4E(YnY)).

综上,有

E(X1+Xn2X)2=σ2(2+4n4n4n)=2(n2)nσ2,
E(T)=cE(X1+Xn2X)2=c2(n2)nσ2=σ2c=n2(n2).

image-20230624141507126

从形式上看,随机变量

Z=2(Y1Y2)S=Y1Y2S2/2

可能服从 t 分布,下面分别验证关于 Y1Y2S2 的分布.

因为 Xi i.i.d.N(μ,σ2),有 Y1N(μ,σ2/6)Y2N(μ,σ2/3),从而

Y1μσ/6=6(Y1μ)σN(0,1),
Y2μσ/3=3(Y2μ)σN(0,1),
6(Y1μ)σ23(Y2μ)σ=6(Y1Y2)σN(0(12),1(12+(2)2))=N(0,3),Y1Y2N(0,σ2/2),Y1Y2σ/2=2(Y1Y2)σN(0,1).

这里用到了:

独立同分布的随机正态变量的线性组合服从正态分布,

T=i=1nciXiN(μi=1nci,σ2i=1nci2).

及样本均值

XN(μ,σ2/n).

原式

Z=Y1Y2S2/2=2(Y1Y2)/σS2/σ2,

又因为

2S2σ2χ22,

这是因为

(n1)S2σ2χn12.

且这里 Y2S2 是相互独立的,

这是因为样本均值 X 和样本方差 S2 是相互独立的.

容易知道 2(Y1Y2)/σ2S2/σ2 也是相互独立的,从而得到 Z 服从自由度为 2t 分布,即

Z=2(Y1Y2)/σS2/σ2=2(Y1Y2)/σ(2S2/σ2)/2t2.

image-20230625215037576

X1,X2,,Xn i.i.d.N(μ,σ2),得

XN(μ,σ2n),Xμσ/n=n(Xμ)σN(0,1).

又由 Xn+1N(μ,σ2),得

Xn+1μσN(0,1).

所以

nXn+1μσn(Xμ)σ=n(Xn+1X)σN(0,n+1),n(Xn+1X)σn+1N(0,1).

另一方面,

m2=n1nS2,

(n1)S2σ2χn12,

n(Xn+1X)σn+1((n1)S2/σ2)/(n1)tn1.
n(Xn+1X)σn+1((n1)S2/σ2)/(n1)=nn+1Xn+1XS2=nn+1Xn+1Xnm2/(n1)=n1n+1Xn+1Xm2.