[TIL_Carrotww] 28 - 22/10/12

์œ ํ˜•์„ยท2022๋…„ 10์›” 13์ผ
0

TIL

๋ชฉ๋ก ๋ณด๊ธฐ
34/138
post-thumbnail

๐Ÿ“Carrotww์˜ ์ฝ”๋”ฉ ๊ธฐ๋ก์žฅ

๐Ÿงฒ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ์ข…๋ฅ˜

๐Ÿ” Support vector machine (SVM)

๊ฐ•์•„์ง€์™€ ๊ณ ์–‘์ด๋ฅผ ๋จธ์‹ ๋Ÿฌ๋‹ํ•˜์—ฌ ํ•™์Šต์‹œํ‚จ๋‹ค๊ณ  ๊ฐ€์ •ํ–ˆ์„๋•Œ ๋ฌด์—‡์„ ๊ตฌ๋ถ„ํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๋ถ„๋ฅ˜ ๋ฌธ์ œ(Classification problem)๋ผ๊ณ  ํ•˜๋ฉฐ, ํ•ด๋‹น ๋ฌธ์ œ๋ฅผ ํ‘ธ๋Š” ๋ชจ๋ธ์„ ๋ถ„๋ฅ˜๊ธฐ(Classifier) ๋ผ๊ณ  ํ•œ๋‹ค. ์œ„ x์ถ•๊ณผ y์ถ•์€ ๊ฐ•์•„์ง€ ๊ณ ์–‘์ด๋ฅผ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋Š” ํŠน์ง•์œผ๋กœ ํ‘œ์‹œ๋ฅผ ํ•˜์˜€๊ณ , ์ •ํ™•๋„๋ฅผ ์˜ฌ๋ฆฌ๊ณ  ์‹ถ๋‹ค๋ฉด ํŠน์ง•์„ ์ถ”๊ฐ€ํ•  ์ˆ˜ ์žˆ๋‹ค. ํŠน์ง•์„ ๋งŽ์ด ์ถ”๊ฐ€ํ•ด ์ฃผ๋ฉด ๋ณดํŽธ์ ์œผ๋กœ ์ •ํ™•๋„๊ฐ€ ์˜ฌ๋ผ๊ฐ„๋‹ค. ex) ์ง–๋Š” ์†Œ๋ฆฌ

์œ„ ๊ทธ๋ฆผ์—์„œ ๊ฐ•์•„์ง€์™€ ๊ณ ์–‘์ด๋ฅผ ๊ตฌ๋ถ„ํ•˜๋Š” ๋นจ๊ฐ„ ์„ ์„ Support vector ๋ผ ๋ถ€๋ฅด๋ฉฐ ๊ฐ ๋ชจ๋ธ๊ณผ์˜ ๊ฑฐ๋ฆฌ๋ฅผ Margin ์ด๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค. Margin์ด ์ปค์งˆ์ˆ˜๋ก ๋ชจ๋ธ๋“ค์ด ๋ช…ํ™•ํžˆ ๊ตฌ๋ถ„๋˜๋Š” ๊ฒƒ์ด๋‹ˆ ์šฐ๋ฆฌ์˜ ๋ชฉํ‘œ๋Š” Margin์ด ๋„“์–ด์ง€๋„๋ก ํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ์ด๋‹ค.

๐Ÿ” k-Nearest neighbors (KNN)

์œ„ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ดํ•ดํ•˜๊ธฐ ๋งค์šฐ ์‰ฝ๋‹ค.
ํŠน์ง•๋ณ„๋กœ ๋ฐฐ์น˜๋ฅผ ํ•œ ํ›„ ํ•ด๋‹น ๊ฐœ์ฒด๊ฐ€ ๊ทผ์ฒ˜์— ์žˆ๋Š” k(๊ฐœ์ˆ˜) ๊ฐ’์„ ๋ณด๊ณ  ์ž์‹ ์˜ ์œ„์น˜๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค.

๐Ÿ” Decision tree (์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด)

์œ„ ์‚ฌ์ง„๊ณผ ๊ฐ™์ด ์Šค๋ฌด๊ณ ๊ฐœ ๋ฐฉ์‹์œผ๋กœ ์ถ”๋ก ์„ ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ฉฐ ์„ฑ๋Šฅ์ด ์ข‹๊ณ  ๊ฐ„๋‹จํ•œ ๋ฌธ์ œ๋ฅผ ํ’€ ๋•Œ ์ž์ฃผ ์‚ฌ์šฉ๋œ๋‹ค.

๐Ÿ” Random forest

Decision tree (์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด)๋ฅผ ์—ฌ๋Ÿฌ๊ฐœ ํ•ฉ์นœ ๋ชจ๋ธ์ด๋ฉฐ ๊ฐ ๋‚˜๋ฌด์—์„œ ๋‚˜์˜จ ๊ฒฐ๊ณผ๊ฐ’์„ ๊ฐ๊ฐ์˜ ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด๋“ค์ด ํˆฌํ‘œํ•˜์—ฌ ์ตœ์ข… ๋‹ต์„ ๊ฐ€๋ฆฌ๋Š” ๋ฐฉ์‹์ด๋‹ค.

๐Ÿงฒ ์žก์„ค

๐Ÿ” ์†”์งํžˆ ์กฐ๊ธˆ ์–ด๋ ต์ง€๋งŒ kaggle ์‚ฌ์ดํŠธ์—์„œ ์žฌ๋ฐŒ๋Š”๊ฒŒ ๋งŽ์•„์„œ ์กฐ๊ธˆ ์ˆ™๋‹ฌ๋˜๋ฉด ์žฌ๋ฐŒ์„ ๊ฒƒ ๊ฐ™๋‹ค๋Š” ์ƒ๊ฐ์ด ๋“ค์—ˆ๋‹ค.
์•„์ง ์•Œ๊ณ ๋ฆฌ์ฆ˜๋„ ์™„๋ฒฝํ•˜๊ฒŒ ์ˆ˜ํ–‰ํ•˜์ง€ ๋ชปํ•˜๋Š”๋ฐ ๋ฐฐ์šธ๊ฒŒ ๋งŽ์•„์ ธ ๋จธ๋ฆฌ๊ฐ€ ์กฐ๊ธˆ ์ง€๋ˆ๊ฑฐ๋ฆฌ์ง€๋งŒ ๋”์šฑ ์—ด์‹ฌํžˆ ํ•ด์•ผ๊ฒ ๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€