Post

[Probabilistics] 확률 이론(10강) - Multivariate Random Variable

다변량 확률 변수의 개념과 joint pmf/pdf를 이해할 수 있습니다.

[Probabilistics] 확률 이론(10강) - Multivariate Random Variable
  • 수식이 제대로 보이지 않는다면, 새로고침(F5)을 해주시기 바랍니다.

이번 시간에는 Multivariate Ramdom Variable 및 joint pmf/pdf에 대해 알아보겠습니다.


Multivariate Random Variable

지금까지는 확률 변수 1개만을 다루었습니다. 이를 Univariate Random Variable이라고 했었는데요, 이번에는 2개 이상의 확률 변수도 다뤄보겠습니다.
2개 이상의 확률 변수일 때는 다변량 확률 변수(Multivariate Random Variable)이라고 합니다.

$n$차원 다변량 확률 변수 $\mathbf{X}$는 다음과 같은 벡터 형태로 정의됩니다.

\[\mathbf{X} = \begin{bmatrix} X_1 \\ X_2 \\ \vdots \\ X_n \end{bmatrix}\]

여기서 각 $X_i$는 개별 확률 변수입니다. $X$, $Y$ 등의 표현을 사용하기도 합니다.

Example

다음은 Multivariate Random variable의 예시입니다. 다변량 확률 변수에 대한 이해가 더 쉬워질 것이라 예상합니다.

1: 신체의 특징을 나타낼 수 있는 정보를 2개 가진 확률 변수로 볼 수 있습니다.

\[\mathbf{X} = \begin{bmatrix} \text{키} \\ \text{몸무게} \end{bmatrix}\]

2: 아래는 세 과목의 시험 점수에 대한 정보를 가진 확률 변수로 볼 수 있습니다.

\[\mathbf{X} = \begin{bmatrix} \text{국어 점수} \\ \text{수학 점수} \\ \text{영어 점수} \end{bmatrix}\]

Joint / Marginal pmf, pdf in Multivariate Random Variables

Multivariate Random Variable인 경우에 PMF와 PDF는 어떻게 나타낼까요? 지금까지 확률 변수가 1개인 pmf/pdf는 marginal pmf/pdf라고 부릅니다.
확률 변수가 2개 이상이며, discrete random variable일 경우에는 joint pmf, continuous random variable일 경우에는 joint pdf라고 부르며, 아래의 식처럼 나타냅니다.
$n$차원 벡터 확률 변수 $\mathbf{X} = [X_1, X_2, \dots, X_n]^\top$에 대하여,

  • Discrete: \(p(x_1, x_2, \dots, x_n) = P(X_1 = x_1, X_2 = x_2, \dots, X_n = x_n)\)

  • Continuous: \(f(x_1, x_2, \dots, x_n) \quad \text{such that} \quad P((X_1, \dots, X_n) \in A) = \int_A f(x_1, \dots, x_n) dx_1 \cdots dx_n\)

Example

확률 변수가 딱 2개인 경우에는 Bivariate Random Variable이라고 부르기도 합니다. 확률 변수가 $X$와 $Y$ 이렇게 2개 있다고 했을 때, joint pmf/pdf는 다음과 같습니다.

  • Discrete: \(p(x, y) = P(X = x, Y = y)\)

  • Continuous: \(f(x, y) = \frac{\partial^2}{\partial x \partial y} F(x, y)\)

    (여기서 $F(x, y)$는 joint cdf입니다. $F_{X,Y}(x,y) = P(X \le x,\; Y \le y)$)

properties of Joint pmf/pdf

1 - 합(또는 적분)이 1이 된다.

  • Discrete (joint pmf)
    \(\sum_{x}\sum_{y} p_{X,Y}(x,y) = 1\)

  • Continuous (joint pdf)
    \(\iint_{\mathbb{R}^2} f_{X,Y}(x,y)\,dx\,dy = 1\)
    지지집합(support 구간)이 $S$로 제한되면
    \(\iint_{S} f_{X,Y}(x,y)\,dx\,dy = 1\)


2 - $Y$ 부분만(을) 모두 더하면/적분하면 $X$의 marginal

  • Discrete
    \(p_X(x) = \sum_{y} p_{X,Y}(x,y)\)

  • Continuous
    \(f_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x,y)\,dy\)


3 - $X$ 부분만(을) 모두 더하면/적분하면 $Y$의 marginal

  • Discrete
    \(p_Y(y) = \sum_{x} p_{X,Y}(x,y)\)

  • Continuous
    \(f_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x,y)\,dx\)


Example: From Joint PDF to Marginal PDF

joint pmf/pdf의 성질 중 2, 3번 성질을 이용해서 marginal pmf/pdf를 구할 수 있음을 알게 되었습니다. 예시 문제 풀이를 통해 이를 확인해봅시다.
Quiz. joint pdf과 다음과 같을 때 $f_X(x)$를 구하시오.

  • $f_{X,Y}(x,y) = e^{-y} $ for $0 < x < y$
  • $f_{X,Y}(x,y) = 0 $ otherwise


풀이:

\[f_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x,y)\,dy\]

고정된 $x>0$에 대해 조건 $0<x<y$를 만족하려면 $y \in [x,\infty)$. 따라서 다음과 같습니다.
\(f_X(x) = \int_{y=x}^{\infty} e^{-y}\,dy \quad (x>0)\)

\[\int_{x}^{\infty} e^{-y}\,dy = \left[-\,e^{-y}\right]_{x}^{\infty} = e^{-x}\]

따라서 \(f_X(x)= \begin{cases} e^{-x}, & x>0 \\ 0, & \text{otherwise} \end{cases}\)

Conclusion

이번 시간에는 multivariate random variable을 알아보았습니다. 또한 marginal pmf/pdf와 joint pmf/pdf를 이해하고, 그 성질을 알아보았습니다. 오늘 한 내용은 확률 이론 내용 중에서도 매우 중요한 부분이니 꼭! 정확히 숙지하고 넘어가시길 바랍니다. 아래에 있는 연습 문제를 통해 이해도를 확인하세요. 이번 강의는 여기서 마치겠습니다.

Practice

Q1. joint pdf가 $f_{X,Y}(x,y)=k\,x\,y\,e^{-y^2/4},\quad 0<x<1,\; y>0$일 때, $X$의 marginal distribution을 구하시오.
Q2. 다음과 같은 결합 누적분포함수(joint cdf)에 대하여, $f_X(x)$를 구하시오.
\(F_{X,Y}(x,y)= \begin{cases} 0, & x<0 \text{ or } y<0,\\[4pt] \big(1-e^{-\lambda x}\big)\big(1-e^{-\mu y}\big), & x\ge 0,\; y\ge 0, \end{cases} \qquad \lambda>0,\; \mu>0.\)

Answer

추후 업로드 예정

This post is licensed under CC BY 4.0 by the author.