๐Ÿ”ธ๋ถ„๋ฅ˜(Classification)

Jiwon Parkยท2023๋…„ 4์›” 13์ผ
0

๋ถ„๋ฅ˜(Classification)

  • ์ง€๋„ํ•™์Šต์˜ ์ผ์ข…์œผ๋กœ, ๊ธฐ์กด ๋ฐ์ดํ„ฐ์˜ category ๊ด€๊ณ„ ํŒŒ์•…ํ•˜์—ฌ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์˜ category ํŒ๋ณ„
  • ์ข…๋ฅ˜:
    • ๋‚˜์ด์ฆˆ ๋ฒ ์ด์ฆˆ(Naive Bayes): ๋ฒ ์ดํŠธ ํ†ต๊ณ„์™€ ์ƒ์„ฑ ๋ชจ๋ธ ๊ธฐ๋ฐ˜
    • ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€(Logistic Regression): ๋…๋ฆฝ๋ณ€์ˆ˜์™€ ์ข…์†๋ณ€์ˆ˜์˜ ์„ ํ˜• ๊ด€๊ณ„์„ฑ์— ๊ธฐ๋ฐ˜
    • ๊ฒฐ์ •ํŠธ๋ฆฌ(Dicision Tree): ๋ฐ์ดํ„ฐ์˜ ๊ท ์ผ๋„ ๊ทœ์น™ ๊ธฐ๋ฐ˜
    • ์„œํฌํŠธ ๋ฒกํ„ฐ ๋จธ์‹ (Support Vector Machine): ๊ฐœ๋ณ„ ํด๋ž˜์Šค ๊ฐ„ ์ตœ๋Œ€ ๋ถ„๋ฅ˜ ๋งˆ์ง„ ํƒ์ƒ‰
    • ์ตœ์†Œ ๊ทผ์ ‘(K-Nearest Neighbor): ๊ทผ์ ‘ ๊ฑฐ๋ฆฌ ๊ธฐ์ค€
    • ์‹ ๊ฒฝ๋ง(Neural Network): ์‹ฌ์ธต ์—ฐ๊ฒฐ ๊ธฐ๋ฐ˜
    • ์•™์ƒ๋ธ”(Ensemble): ์„œ๋กœ ๋‹ค๋ฅธ(๋˜๋Š” ๊ฐ™์€) ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฒฐํ•ฉ

๋ถ„๋ฅ˜ ์„ฑ๊ณผ์ง€ํ‘œ

  • Confusion Matrix(์˜ค๋ถ„๋ฅ˜ํ‘œ, ํ˜ผ๋ˆํ–‰๋ ฌ)
    • TP(True Positive) - ์‹ค์ œ positive๋ฅผ positive๋กœ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์˜ˆ์ธก
    • TN(True Negative) - ์‹ค์ œ negative๋ฅผ negative๋กœ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์˜ˆ์ธก
    • FP(False Positive, Typeโ… error(1์ข… ์˜ค๋ฅ˜)) - ์‹ค์ œ negative๋ฅผ positive๋กœ ์ž˜๋ชป ์˜ˆ์ธก
    • FN(False Negative, Type โ…ก error(2์ข… ์˜ค๋ฅ˜)) - ์‹ค์ œ positive๋ฅผ negative๋กœ ์ž˜๋ชป ์˜ˆ์ธก
  • Accuracy(์ •ํ™•๋„)

    • ์ „์ฒด ์˜ˆ์ธก๊ฐ’ ์ค‘ ์‹ค์ œ๊ฐ’์„ ์–ผ๋งˆ๋‚˜ ์ •ํ™•ํžˆ ์˜ˆ์ธกํ–ˆ๋Š”์ง€
    • ํŽธํ–ฅ ํ•จ์ • ์กด์žฌ
  • Precision(์ •๋ฐ€๋„)

  • Recall(Sensitivity; ์žฌํ˜„๋„)
  • Specificity(ํŠน์ด๋„)
  • F1 score
  • ROC(AUC, AUROC)
profile
Data Science

0๊ฐœ์˜ ๋Œ“๊ธ€