Mathematics/probability statistics

기댓값

jwjwvison 2022. 3. 23. 20:36

 X가 확률변수일 때의 기댓값(expectation)을 다음과 같이 정의한다.

 연속확률변수인 경우에는 적분으로 변경하면 된다. 기댓값은 X가 가질 수 있는 값이 x1,x2,,,xn일 때 이 값들의 가중평균(weight average)이라고 할 수 있다.

 이런 의미에서 E(X)를 X의 평균값이라고 한다.

 

 수학적 기댓값 중에서 또다른 중요한 기댓값은 분산이다. u=E(X)라고 하자.

 이 값은 평균과의 차이에 제곱, 즉 평균과의 편차 제곱에 대한 가중평균이라고 할 수 있다. 이 값을 확률변수 X의 분산이라고 하며 일반적으로 아래 기호를 사용한다.

분산

  분산의 양의 제곱근을 표준편차 라고 한다.

import sympy
x=sympy.Symbol('x')
mu=sympy.integrate(x*1/2, (x, -1,1))
mu   #0

EX2=sympy.integrate(x**2*1/2, (x,-1,1))
EX2  #1/3

sigma2=EX2-mu**2
sigma2   #1/3

sigma=sympy.sqrt(sigma2)
sigma

 데이터가 많이 넓게 분포되어 있을수록 표준편차 값이 큰 값임을 확일할 수 있다.

 

 

a,b,x=sympy.symbols('a,b,x')
mu=sympy.integrate(x/(b-a), (x,a,b))

# 원래 값, 통분하기, 인수분해하기
mu, mu.together(), mu.factor()

# 제곱 기댓값
EX2=sympy.integrate(x**2/(b-a), (x,a,b))
EX2.factor()

sigma2=EX2-mu**2
sigma2.factor()

 

 기댓값 중에 또 하나의 수학적으로 의미 있는 값은 확률변수 X의 적률생성함수(moment generating function)이다.

 잘 알려진 확률변수에 대한 적률생성함수는 다음과 같다.

 

'Mathematics > probability statistics' 카테고리의 다른 글

상관계수  (0) 2022.03.26
주변분포와 조건부분포  (0) 2022.03.26
조건부확률  (0) 2022.03.26
확률변수, 확률 밀도 함수  (0) 2022.03.23
확률 시행과 표본 공간, 사건과 상대도수  (0) 2022.03.22