๐๏ธ YOUTUBE
๐๏ธ MATERIAL
CS 188: Introduction to Artificial Intelligence, Fall 2018
๐๏ธ 2022-02-20
$P(Y,F_1...F_n)=P(Y)\prod_i P(F_i|Y)$
feature๊ฐ ํด๋์ค์ ์ด๋ป๊ฒ ์์กด์ ์ธ์ง(์ฆ ๊ฐ์ด ๋ณํํจ์ ๋ฐ๋ผ ์ด๋ป๊ฒ ๋ฌ๋ผ์ง๋์ง) ํ์ ํ๋ค.
ํ๋ผ๋ฏธํฐ์ ์ด ๊ฐ์๋ ์ ํ์
label ๋ณ์ $Y$์ ๋ํ posterior ๋ถํฌ๋ฅผ ๊ณ์ฐํด์ผ ํ๋ค.
๊ฐ label์ ๋ํ evidence์ label์ ๊ฒฐํฉ ํ๋ฅ ์ ์ป์ด๋ผ ์ ์๋ค. ์ฆ $\prod$๋ก ๋ฌถ์ด๋ธ๋ค.
์ดํ evidence ํ๋ฅ ์ ๋ชจ๋ ํฉํ๋ค.
์ ๊ทํํ๋ค.
์ถ๋ก ์ ํ๋ ๋ฐ ์ฌ์ฉ๋๋ค.
๋ชจ๋ธ๋ง ํ๋ผ๋ฏธํฐ์ ๊ดํ ํ๋ฅ ํ์
๋ฐ์ดํฐ๋ฅผ ํตํด ํน์ ํ ๋ถํฌ๊ฐ ํ์ฑ๋ ์ ์๋ค.
๊ฐ label์ ๋ํ ํ๋ฅ ๊ณผ feature์ ์ฌ์ฉํ ํ๋ฅ ์ ํ์ ํ๋ค.
ํ ์คํธ ๋์ด๋ธ ๋ฒ ์ด์ฆ
ํ๋ จ ๋ฐ์ดํฐ์ ์์ ํ์ตํ ๋ชจ๋ธ๋ง์ด ํ ์คํธ ๋ฐ์ดํฐ์ ์์ ์ผ๋ง๋ ์ ์๋ํ ๊ฒ์ธ์ง ํ์ธํด์ผ ํ๋ค.
ํ๋ จ ๋ฐ์ดํฐ์ ์์ ์ต์ ํ๋ ๋ชจ๋ธ์ด ๋ค๋ฅธ ๋ฐ์ดํฐ์ ์์ ์ผ๋ง๋ ์ผ๋ฐํ๋ ์ ๋๋ก ์ฑ๋ฅ์ด ์ข์์ง ํ์ธํ ๋, ๊ณผ์ ํฉ๋์ง ์์๋์ง ํ์ธํ๋ค.
ํ๋ จ ๋ฐ์ดํฐ ๊ฐ์๋ฅผ ๋๋ฆฌ๊ฑฐ๋, ์ ๊ทํ์ ์ ๋ ๋๋ ๊ฐ์ค์ด ์ฌ์ฉํ๋ ๊ณต๊ฐ์ ๋ณต์ก๋๋ฅผ ์ค์ผ ๋ ๊ณผ์ ํฉ์ ๋ฐฉ์งํ ์ ์๋ค.
๊ณผ์์ ํฉ์ผ ๋์๋ ํ๋ จ ๋ฐ์ดํฐ์๋ ํ์ต์ด ์ ๋์ง ์์๋ค๋ ๋ป์ด๋ค.
๊ณผ์ ํฉ/๊ณผ์์ ํฉ ์ด์๊ฐ ์๊ธฐ ๋๋ฌธ์ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ๋ง์ถ๋ ์ ํ๋๋ก๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๋จํ ์ ์๋ค.
๋ชจ๋ธ์ ์ข ๋ฅ์ ๋ฐ๋ผ ๊ณผ์ ํฉ์ ๋ํ๋ด๋ ๋ฐฉ๋ฒ์ด ์๋ก ๋ค๋ฅด๋ค.
๋๋ค ๋ณ์ ๋ถํฌ๋ฅผ ํ์ ํด ์ ์ฒด ์ํ ์ค ํด๋น ๋ณ์์ ๊ฐ์๋ฅผ ํ๋ฅ ๋ก ์ฌ์ฉํ ์ ์๋ค.
ํ์ฌ๊น์ง ์ฐพ์ ์ํ ๊ธฐ๋ฐ์ผ๋ก โ๊ฐ์ฅ ๊ฐ๋ฅํ ๋ฒํโ ํ๋ฅ ์ด๋ค.
likelihood of the data๋ฅผ ์ต๋๊ฐ์ผ๋ก ๋ง๋๋ ์ถ์ ์ด๋ค.
$L(x,\theta)=\prod_iP_{\theta}(x_i)$
$\theta_{ML}=arg max_{\theta}P(X|\theta)=argmax_{\theta}\prod_iP_{\theta}(X_i)$
$\theta_{MAP}=argmax_{\theta}P(\theta|X)$
Laplace Smoothing์ ํตํด ๋ชจ๋ ๊ฒฐ๊ณผ๊ฐ์ k ๋ฒ ๋ ๊ด์ฐฐํ ๊ฒ์ผ๋ก ๋ง๋ ๋ค. ์ฆ ๋ณด์ง ์์ ์ฌ๊ฑด์ ๋ค๋ฃจ๊ธฐ ์ํด flattenํ๋ ๋ฐฉ๋ฒ์ด๋ค.
์ด๋ k๋ prior ์ฌ์ ํ๋ฅ ์ด ์ผ๋ง๋ ๊ฐํ ์ํฅ์ ๋ฏธ์น๋์ง ๋ณด์ฌ์ค๋ค.
๋์ด๋ธ ๋ฒ ์ด์ฆ์ ๋ํ smoothing์ ํตํด ๊ณผ์ ํฉ์ ๋ฐฉ์งํ ์ ์๋ค.
label 1 ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ label 2 ์กฐ๊ฑด๋ถ ํ๋ฅ vs label 2 ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ label1 ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ฑ ์ ์๋ฏธํ ํ๋ผ๋ฏธํฐ๋ฅผ ๊บผ๋ด ์ธ ์ ์๋ค.
ํ๋ผ๋ฏธํฐ label ํ๋ฅ ๋ฐ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ ๊ฐ๋ฅผ ํตํด ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฌ์ฉํด ํ๋ํ ์ ์๋ค.
NB์ ์ฌ์ฉํ feature์ ๋ค์ํ ์์๋ฅผ ํตํด ์๋ฌ๋ฅผ ๋ฐฉ์งํ ์ ์๋ค.