X가 확률변수일 때의 기댓값(expectation)을 다음과 같이 정의한다.
연속확률변수인 경우에는 적분으로 변경하면 된다. 기댓값은 X가 가질 수 있는 값이 x1,x2,,,xn일 때 이 값들의 가중평균(weight average)이라고 할 수 있다.
이런 의미에서 E(X)를 X의 평균값이라고 한다.
수학적 기댓값 중에서 또다른 중요한 기댓값은 분산이다. u=E(X)라고 하자.
이 값은 평균과의 차이에 제곱, 즉 평균과의 편차 제곱에 대한 가중평균이라고 할 수 있다. 이 값을 확률변수 X의 분산이라고 하며 일반적으로 아래 기호를 사용한다.
분산의 양의 제곱근을 표준편차 라고 한다.
import sympy
x=sympy.Symbol('x')
mu=sympy.integrate(x*1/2, (x, -1,1))
mu #0
EX2=sympy.integrate(x**2*1/2, (x,-1,1))
EX2 #1/3
sigma2=EX2-mu**2
sigma2 #1/3
sigma=sympy.sqrt(sigma2)
sigma
데이터가 많이 넓게 분포되어 있을수록 표준편차 값이 큰 값임을 확일할 수 있다.
a,b,x=sympy.symbols('a,b,x')
mu=sympy.integrate(x/(b-a), (x,a,b))
# 원래 값, 통분하기, 인수분해하기
mu, mu.together(), mu.factor()
# 제곱 기댓값
EX2=sympy.integrate(x**2/(b-a), (x,a,b))
EX2.factor()
sigma2=EX2-mu**2
sigma2.factor()
기댓값 중에 또 하나의 수학적으로 의미 있는 값은 확률변수 X의 적률생성함수(moment generating function)이다.
잘 알려진 확률변수에 대한 적률생성함수는 다음과 같다.
'Mathematics > probability statistics' 카테고리의 다른 글
상관계수 (0) | 2022.03.26 |
---|---|
주변분포와 조건부분포 (0) | 2022.03.26 |
조건부확률 (0) | 2022.03.26 |
확률변수, 확률 밀도 함수 (0) | 2022.03.23 |
확률 시행과 표본 공간, 사건과 상대도수 (0) | 2022.03.22 |