VAE: Variational Autoencoder
VAE: Variational Autoencoder
๐ฃ Intro
๋ํ์ ์ธ generative model์ ์ฒซ ๋ฒ์งธ ์๋ฆฌ์ฆ์ธ VAE์ ๋ํด์ ์ ๋ฆฌํด๋ณด๋ ค๊ณ ํ๋ค.
โช VAE (Variational AutoEncoder)๋?
- VAE๋ ํ๋ฅ ์ latent space๋ฅผ ํ์ตํ๋ ์์ฑ๋ชจ๋ธ (Generative Model) ์ด๋ค. ๊ธฐ์กด์ AutoEncoder๋ latent vector๋ฅผ ๋จ์ํ ๋ฒกํฐ๋ก ์์ถํ์ง๋ง, VAE๋ ์ด๋ฅผ ํ๋ฅ ๋ถํฌ๋ก ๋ณธ๋ค.
- ์์ด๋์ด: ๋ฐ์ดํฐ๋ฅผ ์ ์ฌ ๊ณต๊ฐ(z)์ผ๋ก ์ธ์ฝ๋ฉ ํ ํ๋ฅ ์ ์ผ๋ก ๋ณต์
- ์์: $p(x, z) = p(x|z)p(z)$
- ๋ชฉ์ : ELBO (Evidence Lower Bound) ์ต์ ํ
- ์ฅ์ : ํ์ต ์์ , ํ๋ฅ ๊ธฐ๋ฐ ์์ฑ
- ๋จ์ : ์ด๋ฏธ์ง๊ฐ ํ๋ฆฟํ ์ ์์
์ฒ์ ๊ณต๋ถํ ๋ โVariationalโ์ด๋ผ๋ ๋จ์ด๊ฐ ์ฝ๊ฒ ์๋ฟ์ง ์์์ ๊ณ ์ํ์๋ ๋ชจ๋ธ์ด์๋ค..
โช ์์ ์ ๋ฆฌ
VAE์ ๋ชฉ์ ์ ๋ค์์ evidence lower bound (ELBO)๋ฅผ ์ต๋ํํ๋ ๊ฒ:
\[\log p(x) \ge \mathbb{E}_{q(z|x)}[\log p(x|z)] - D_{KL}(q(z|x) \| p(z))\]โช ๊ตฌ์กฐ ์์ฝ
- Encoder: ์ ๋ ฅ ( x ) โ latent ๋ถํฌ ( z \sim \mathcal{N}(\mu, \sigma^2) )
- Decoder: ( z ) โ ๋ณต์๋ ์ด๋ฏธ์ง ( \hat{x} )
- Loss:
- ๋ณต์ ์์ค: ( |x - \hat{x}|^2 )
๋ถํฌ regularization (KL divergence): ( D_{KL}(q(z x) | p(z)) )
โช ํน์ง
ํญ๋ชฉ | ์ค๋ช |
---|---|
์ฅ์ | Latent space๊ฐ ์ฐ์์ , sampling ๊ฐ๋ฅ |
๋จ์ | ์ด๋ฏธ์ง ํ์ง์ด blurryํจ (pixel-wise loss ๋๋ฌธ) |
์์ฉ | Image generation, anomaly detection, disentanglement |
๐ฃ ๋ง์น๋ฉฐ
VAE์ ํต์ฌ ์์ด๋์ด๋ ์ธ์ฝ๋๊ฐ ์ด๋ฏธ์ง๋ฅผ ์ ์ฌ ๊ณต๊ฐ์ ํน์ ํ ์ (a single point) ์ผ๋ก ๋งคํํ๋ ๋์ , ํ๋ฅ ๋ถํฌ(a probability distribution) ๋ก ๋งคํํ๋๋ก ํด์ latent space๊ฐ ๋ถ๋๋ฝ๊ฒ ์ฑ์์ง๋๋ก ํ๋ค.
์ด๋ฌํ ์์ด๋์ด๋ ๋ฅ๋ฌ๋ ๊ณต๋ถ์์ generative model์ ์ดํด๋ฅผ ๋๊ณ , ๋ํ ํต๊ณ์ ์ญ๋์ ๋๋ฆด ์ ์๋ ์ ์๋ฏธํ ๊ณต๋ถ์ผ ๊ฒ์ด๋ค.
Reference
This post is licensed under CC BY 4.0 by the author.