# sklearn

143개의 포스트
post-thumbnail

[Data Analysis] 홈런 개수 예측 - 모델 생성

목차 데이터 준비 데이터 불러오기 결측치 처리 feature select 데이터 분할 Model select (모델 선택) Model Train (훈련) Model evaluation (평가) Predict (예측) 1.데이터 준비 및 전처리 데이터 불러오기

어제
·
0개의 댓글
·

ModuleNotFoundError: No module named 'sklearn'

ModuleNotFoundError: No module named 'sklearn'가 발생한다면 해결!

2023년 11월 2일
·
0개의 댓글
·
post-thumbnail

[Python] 선형회귀(Linear Regression)

머신러닝의 지도학습(Supervised Leanring)에는 회귀(Regression)과 분류(Classification)의 개념이 존재한다. 회귀는 연속적인 수치형 데이터를 예측하는 모델이고, 분류는 'Y or N', '사과 or 포도'처럼 범주형 데이터를 분류하는

2023년 11월 1일
·
0개의 댓글
·
post-thumbnail

[Python] 데이터 스케일링을 위한 5가지 방법

데이터 모델링을 진행할 때 각 특성별로 스케일이 다르면 모델링 결과가 달라질 수 있어서 사전에 꼭 데이터 스케일링을 진행해줘야 한다. 예를 들어 특성 A와 B를 사용하여 모델링을 진행할 때, 특성 A의 스케일이 0~1,000이고, 특성 B의 스케일이 0~10이라면, 컴

2023년 10월 17일
·
0개의 댓글
·
post-thumbnail

[ML] Logistic regression (로지스틱 회귀)

선형 분류기 logistic regression (로지스틱 회귀) 와 sigmoid 함수 개요 및 scikit learn 기반 예제

2023년 8월 14일
·
0개의 댓글
·
post-thumbnail

인공지능 스터디 5주차 - Machine Learning 기초

머신러닝의 간단한 흐름과 대표적인 도구인 sklearn을 학습함.머신러닝은 데이터가 가지는 특징(Feature)과 Target 사이의 패턴을 파악하는 일문제1 데이터 불러오기(유방암 데이터)문제2 train_test_split(데이터 분리)머신러닝을 위해서는 학습데이터

2023년 8월 9일
·
0개의 댓글
·
post-thumbnail

AICE자격증을 위한 M.L 코드

나는 주로 다루는 것이 파이토치 딥러닝을 주로 다루어 왔다. 이번 방학에 기본기를 다지고자 AICE자격증을 신청했고, pandas와 matplotlib seaborn에 대해서 기본기를 숙달하기 좋은 기회였다. 그에 비해 너무나 방대한 ML DL은 사용해보는 정도의 수준

2023년 7월 18일
·
2개의 댓글
·
post-thumbnail

Linear Regression

‣ data : diabetes sklearn을 이용하여 databetes 데이터셋을 분석해보자. diatbetes의 columns 이 외에도, 아래와 같은 코드들로 diabetes data를 탐색할 수 있다. : 예측할 때 사용될 diabetes의 featur

2023년 6월 29일
·
0개의 댓글
·

분류 모델 평가 지표 - Confusion Matrix

내가 보려고 쓴 BDAA 복습

2023년 3월 30일
·
0개의 댓글
·

머신러닝 - 모델

사이킷런에서는 다양한 회귀, 분류 알고리즘을 제공하고 있다. 하나하나 차근차근 알아보도록 하자.

2023년 3월 19일
·
0개의 댓글
·

머신러닝 기본

머신러닝 기본 정리

2023년 3월 16일
·
0개의 댓글
·

머신러닝 - 개괄

머신러닝? ML(머신러닝)은 사용하는 데이터를 기반으로 학습 또는 성능 향상을 지원하는 시스템을 구축하는 데 초점을 맞추는 인공 지능(AI)의 하위 집합입니다.

2023년 3월 15일
·
0개의 댓글
·
post-thumbnail

머신러닝 정리(3)

MLP 란 여러 개의 퍼셉트론 뉴런을 여러 층으로 쌓은 다층신경망 구조입력층과 출력층 사이에 하나 이상의 은닉층을 가지고 있는 신경망이다.처음엔 퍼셉트론이라는 이진 분류기가 시작이었다.근데 이 퍼셉트론은 선형분류 밖에 하지 못했다.하지만 선형 분류로는 정확한 분류를 할

2023년 2월 28일
·
0개의 댓글
·
post-thumbnail

머신러닝 정리(2)

비선형분류모델로 많이 사용되는 분류기 중 하나이며 데이터에 대한 분류 이유를 설명할 수 있다는 특징을 가지고 있다. 동일한 데이터 셋에 대해 여러 개의 다른 구조의 트리 모델을 학습시킬 수 있다.의사결정나무 모델을 학습하는 알고리즘. (그리디한 알고리즘)그리디한 알고리

2023년 2월 28일
·
0개의 댓글
·
post-thumbnail

머신러닝 정리(1)

머신러닝에 사용되는 데이터는 그 값이 너무 크거나 작지 않고 적당한 범위 (-1에서 ~ 1사이)에 있어야 모델의 정확도가 높아진다고 알려져있다.값의 범위를 0 ~ 1로 변환시킨다ex) 결과 0 ~ 1로 변환 시킴 -> 중간에 큰 값이 있어도 균일하게 변환됨값의 볌위를

2023년 2월 28일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 5장_회귀 - 다항 회귀

회귀가 독립변수의 단항식이 아닌 2차, 3차 방정식과 같은 다항식으로 표현되는 것을 다항(Polynomial) 회귀라고 한다.한 가지 주의할 것은 다항 회귀를 비선형 회귀로 혼동하기 쉽지만, 다항 회귀는 선형 회귀라는 점이다.회귀에서 선형 회귀/비선형 회귀를 나누는 기

2023년 1월 14일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 5장_회귀 - 선형 회귀

LinearRegression()예측값과 실제 값의 RSS를 최소화해 OLS(Ordinary Least Squares) 추정 방식으로 구현한 클래스입력 파라미터fit_intercept: 불린 값, intercept(절편) 값 계산 여부 지정 (default=True)n

2023년 1월 13일
·
0개의 댓글
·

[머신러닝 완벽 가이드] 5장_회귀 - 개요

📌 회귀 (Regression) ✅ 소개 데이터 값이 평균과 같은 일정한 값으로 돌아가려는 경향을 이용한 통계학 기법 여러 개의 독립변수와 한 개의 종속변수 간의 상관관계를 모델링하는 기법을 통칭 머신러닝 관점에서 보면 독립변수는 피처에 해당되며 종속변수는 결

2023년 1월 12일
·
0개의 댓글
·