0. 데이터 구조

Untitled

1. 모형가정

1) cdf, pdf 정의 $\left(\int f(x)dx=1\right)$

<case 1>

전제조건

$\alpha$의 gamma function

$$ ⁍ $$

$\alpha=1$일 때

$$ \Gamma(1)=\int_{0}^{\infty}e^{-y}dy=1 $$

$\alpha>1$일 때

$$ \Gamma(\alpha)=\int_{0}^{\infty}y^{\alpha-2}e^{-y}dy=(\alpha-1)\Gamma(\alpha-1) \\ \Gamma(\alpha)=(\alpha-1)(\alpha-2)\cdots(3)(2)(1)\Gamma(1)=(\alpha-1)! $$

Gamma Distribution

$$ f_{\tiny{X}}(x)= \begin{cases}{\beta^\alpha\over\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} & 0<x<\infty \\ 0 & e.w \end{cases} \\ X\sim\Gamma(\alpha, \beta) $$

$\int f_{\tiny{X}}(x)dx=1$

모든 $x>0$에 대해 $f(x)>0$ 임을 확인

변수변환 : $z={\beta x}, \quad dz=\beta dx$ 이용 $\left(\rightarrow x={z\over\beta} , \quad dx={1\over\beta} dz \right)$

$$ \begin{align*} \int_{0}^{\infty}{\beta^\alpha\over\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x}dx &= \int_{0}^{\infty}{\beta^\alpha \over \Gamma(\alpha)}\left({z\over \beta}\right)^{\alpha-1}e^{-z}{1\over\beta} dz \\ &= {\beta^{\alpha}\over\Gamma(\alpha)}\left({1\over\beta}\right)^{\alpha}\int_{0}^{\infty}z^{\alpha-1}e^{-z}dz \\ &={\beta^{\alpha}\over\Gamma(\alpha)}\left({1\over\beta}\right)^{\alpha}\Gamma(\alpha) = 1 \\ \rightarrow \mathrm{used}\ \int_{0}^{\infty} z^{\alpha-1}e^{-z} dz = \Gamma(\alpha) \end{align*} $$

<case 2>

평균 $\lambda$를 갖는 포아송 과정에서 첫 사건이 일어날 때 까지 걸리는 시간이 지수분포를 따르고 이 상황이 $\alpha$번째 발생이 일어날 때까지 걸리는 시간을 $X$라고 했을 때 $X$의 cdf는 아래와 같고, $X$가 연속형 확률변수이기 때문에 도함수가 존재할 때 이는 $X$의 pdf와 동일하다. 이러한 형태의 pdf는 감마 pdf 형태 중 하나이며 확률변수 $X$는 감마분포를 갖는다.

지수분포와 감마분포의 차이점

지수분포는 “첫번째” 사건이 발생하기 까지 걸린 시간

감마분포는 “$\alpha$번째” 사건이 발생하기 까지 걸린 시간

따라서 우리는 포아송 프로세스에서 감마분포를 파생할 수 있음

$X$ : $\alpha$번째 사건이 발생할 때까지 걸린 시간

$\alpha$ : 감마분포의 첫번째 모수, 사건의 수

$\lambda$ : 감마분포의 두번째 모수, 포아송 프로세스를 따르는 사건의 비율 ($\lambda x$ : poisson rate)

$P(X>x)$ : $\alpha$번째 사건까지의 걸린 시간이 $x$ 시간보다 클 확률

$P(X=k\ \mathrm{in\ } x\ \mathrm{time\ units})$ : $x$ time units 동안 발생한 사건 $\alpha$의 포아송 확률

$\therefore$ cdf is..

$$ \begin{align*} P(X \le x) &= 1-P(X > x) \\ &= 1-P(0, 1, 2, \cdots, \alpha-1 \ \mathrm{events \ in} \ [0,x]) \\ &= 1-\sum_{k=0}^{\alpha-1}{(\lambda x)^k e^{-\lambda x}\over k!} \end{align*} $$

첫번째, 두번째 항은 지수분포의 유도와 동일하지만 $T$ 시간동안 0개 사건 대신 $k-1$개 multiple events를 제외함

$\therefore$ pdf is..

$$ \begin{align*} {d\over dx}\left( 1-\sum_{k=0}^{\alpha-1}{(\lambda x)^k e^{-\lambda x}\over k!} \right) &= \lambda e^{-\lambda x} - {d\over dx}\left( \sum_{k=1}^{\alpha-1}{(\lambda x)^k e^{-\lambda x}\over k!}\right) \\ &= \lambda e^{-\lambda x} - \sum_{k=1}^{\alpha-1}{1\over k!}\left( k(\lambda x)^{k-1}\lambda e^{-\lambda x} -\lambda(\lambda x)^k e^{-\lambda x} \right) \\ &= \lambda e^{-\lambda x} - \lambda e^{-\lambda x}\sum_{k=1}^{\alpha-1}{1\over k!}(k(\lambda x)^{k-1}-(\lambda x)^k) \\ &= \lambda e^{-\lambda x} + \lambda e^{-\lambda x}\sum_{k=1}^{\alpha-1}\left({(\lambda x)^k\over k!}-{(\lambda x)^{k-1} \over (k-1)!} \right) \\ &= \lambda e^{-\lambda x} + \lambda e^{-\lambda x} \left( \lambda x - 1 + {(\lambda x)^2\over 2!} - \lambda x + {(\lambda x)^3\over 3!} - {(\lambda x)^2\over 2!} + \cdots + {(\lambda x)^{\alpha-1}\over (\alpha-1)!} - {(\lambda x)^{\alpha-2}\over (\alpha-2)!} \right) \\ &= \lambda e^{-\lambda x} + \lambda e^{-\lambda x} \left({(\lambda x)^{\alpha-1}\over (\alpha-1)!}-1 \right) = {\lambda e^{-\lambda x}(\lambda x)^{\alpha-1}\over (\alpha-1)!} \\ &={\lambda e^{-\lambda x}(\lambda x)^{\alpha-1}\over(\alpha-1)!}={\lambda^\alpha x^{\alpha-1} e^{-\lambda x}\over \Gamma(\alpha)} \end{align*} $$

사건 발생까지 걸린 시간이 비율 $\lambda$의 포아송 프로세스를 따르는 경우, $\alpha$ 사건이 발생하기까지 걸린 시간은 $\Gamma(\alpha, \lambda)$를 따름

$\Gamma(\alpha, \beta)$로 모수를 표현할 경우,

$k\rightarrow \alpha$로, $\lambda\rightarrow \beta$로 대체함 ($\lambda$도 사건의 비율, $\beta$도 사건의 비율)

$\Gamma(\alpha, \theta)$로 모수를 표현할 경우,

$k\rightarrow \alpha$로, ${1\over\lambda}\rightarrow \theta$로 대체함 ($\theta$는 사건 발생까지 걸린 평균 시간, $\lambda$의 역수)

$\therefore \ \alpha: \mathrm{shape \ parameter } , \ \begin{cases}\beta(=\lambda): \mathrm{rate\ parameter} \\ \theta: \mathrm{scale\ parameter} \end{cases}$

3) mgf 유도

$$ \begin{align*}M_{\tiny{X}}(t) &= \int_{0}^{\infty}e^{tx}{\beta^\alpha\over\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x}dx \\ &= {\beta^\alpha\over\Gamma(\alpha)} \int_{0}^{\infty}x^{\alpha-1} e^{-(\beta-t)x}dx \\ &= {\beta^\alpha\over\Gamma(\alpha)} \int_{0}^{\infty}\left({y\over \beta-t}\right)^{\alpha-1}e^{-y}{dy\over\beta-t} & \left(\because(\beta-t)x=y; \ dy=(\beta-t)dx\right) \\ &= {\beta^\alpha\over\Gamma(\alpha)(\beta-t)^\alpha} \int_{0}^{\infty}y^{\alpha-1}e^{-y}dy \\ &= {\beta^\alpha\over(\beta-t)^\alpha} = \left({\beta-t\over\beta}\right)^{-\alpha} = \left(1-{t\over\beta}\right)^{-\alpha}\end{align*} $$

2. 모형의 성질

1) 확률변수의 기댓값, 분산

mgf(moment generate function)를 이용해 기댓값, 분산 구할 수 있음

$$ \begin{align*} & M_{\tiny{X}}'(t)= {\beta^\alpha\alpha\over(\beta-t)^{\alpha+1}} \\ &M_{\tiny{X}}''(t) = {\beta^\alpha\alpha(\alpha+1)\over(\beta-t)^{\alpha+2}} \end{align*} $$