-
기대값은 랜덤 변수가 가질 수 있는 값들의 가중 평균이다.
즉, 확률적으로 어떤 값이 평균적으로 나올지 계산하는 거다.
예를 들어 주사위를 던질 때 각 면의 숫자에 해당하는 기대값을 구할 수 있다.
하지만, 주의해야 할 점은 기대값이 꼭 랜덤 변수가 실제로 가질 수 있는 값은 아니다.
예를 들어 주사위 던지기의 기대값은 3.5지만, 주사위에 3.5라는 숫자는 없다.
주사위를 한 번 던졌을 때의 기대값을 구해보자. 주사위의 각 면이 나올 확률은 모두 같으니까,
x = 1, 2, 3, 4, 5, 6
P(X = x) = 1/6
기대값 E(X)는 다음과 같이 계산된다.
(1 x 1/6) + (2 x 1/6) + (3 x 1/6) + (4 x 1/6) + (5 x 1/6) + (6 x 1/6) = 3.5
즉, 주사위를 던졌을 때 평균적으로 나올 수 있는 값은 3.5라는 거다.
물론 3.5라는 숫자는 주사위에 없지만, 이게 평균적인 결과라는 뜻이다.
분산은 기대값과 실제 값 사이의 차이를 제곱해서 평균적으로 얼마나 떨어져 있는지 계산하는 거다.
즉, 랜덤 변수 값들이 기대값 주변에서 얼마나 퍼져 있는지를 나타내는 척도다.
분산이 클수록 값들이 많이 퍼져 있고, 작을수록 기대값 근처에 모여 있는 거다.
주사위의 분산을 계산해보자.
앞서 구한 주사위의 기대값 E(X)는 3.5였다.
각 숫자에서 기대값을 빼고, 그 차이를 제곱한 후 확률을 곱해 더하면 분산이 구해진다.
Var(X) = ( (1 - 3.5)^2 x 1/6) + ~~~~) = 2.92
즉, 주사위를 던졌을 때 나오는 값들이 평균적으로 기대값에서 약 2.92만큼 떨어져 있다는 걸 의미한다.
표준 편차는 분산의 양의 제곱근이다.
분산은 값이 제곱된 상태로 계산되기 때문에 실제 값들과의 차이를 이해하기 어렵다.
그래서 분산에 루트를 씌워서 실제 값들과의 차이를 좀 더 직관적으로 보여주는 게 표준 편차다.
위 예시에서 분산이 2.92였으니까, 표준 편차는 루트2.92 = 1.71이 된다.
기대값은 랜덤 변수의 평균적인 결과를 나타내고, 분산은 그 결과들이 얼마나 흩어져 있는지를 보여준다.
만약 분산이 작으면 값들이 기대값에 근접해 있고, 분산이 크면 값들이 기대값에서 멀리 퍼져 있다는 의미다.
경영학이나 경제학에서 기대값과 분산을 사용하면, 어떤 선택의 결과를 예측하고, 리스크를 평가하는 데 유용하게 쓰일 수 있다.
'경제' 카테고리의 다른 글
초기하 분포와 포아송 분포 (3) 2024.09.20 이항 분포란? (2) 2024.09.20 랜덤 변수의 개념과 이산 확률 분포 (0) 2024.09.20 상관관계(Correlation)와 인과관계(Causation)의 차이 (0) 2024.09.14 두 변수 간의 관계 측정 (0) 2024.09.14