# scikit learn

69개의 포스트
post-thumbnail

scikit-learn 잠재요인 협업 필터링

scikit learn으로 잠재요인 협업 필터링을 구현해 보았습니다.미리 셋팅해둔 user 별점이 등록된 csv와 상점 데이터가 들어있는 csv를store명 즉 store라벨 기준으로 pandas로 결합 하였다.유저별로 상점에 부여한 별점을 확인하기 위해 pivot t

2022년 6월 14일
·
0개의 댓글
post-thumbnail

Pytorch 건드려보기: Pytorch로 하는 linear regression

쏘카x멋쟁이사자처럼 AI Engineer 부트캠프 TIL

2022년 5월 25일
·
3개의 댓글
post-thumbnail

[수업 4째주 14일차] 머신러닝-5

오늘은 어제에 이어 pandas를 이용해 표로 작성한 데이터로 그래프로 결과값을 보여주는 'Matplotlib'라이브러리를 배웠다. 그 전에 어제 배웠던 pandas를 이용한 표를 다시 나타내 보기로 했다.아래 자료는 미국의 69년도 부터 08년도까지의 성별 출생률을

2022년 4월 8일
·
0개의 댓글

Day.15) AI_Python-데이터관련 필수라이브러리 2

\-지난시간 복습\-판다스 시리즈,데이터프레임 활용 테이블 생성 1969-2008년 미국의 출생율 10년단위로 연대별 성별대비 출생비율 꺾은선 그래프생성링크1\-matplotlib0-100가지의 수 배열데이터 생성하여 sin, cos그래프 그리기(곡선그래프)\-그래프

2022년 4월 8일
·
0개의 댓글
post-thumbnail

사이킷런 scikit-learn

사이킷런은 파이썬의 머신러닝 라이브러리인데요, 오픈소스로서 자유로운 사용 및 배포가 가능하고,머신러닝 알고리즘에 관한 자세한 설명도 제공하고 있습니다.cmd에서 다음과 같이 사이킷런을 임포트합니다.사이킷런은 파이썬 패키지 Numpy와 Scipy를 사용하고, 그래프를 그

2022년 3월 8일
·
0개의 댓글
post-thumbnail

[혼공머신] 순환 신경망 : LSTM, GRU 셀

혼자 공부하는 머신러닝+딥러닝 책에 기반한 정리글입니다.전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다.Github 링크일반적으로 기본 순환층은 긴 시퀸스를 학습하기 어렵다. 멀리 떨어져 있는 단어 정보를 인식하기 어려울 수 있는데, 이는 시퀸스가 길수록

2022년 2월 23일
·
0개의 댓글

[ML]Scikit-learn VS Tensorflow

머신러닝 학습 알고리즘 및 모델이 탄탄하게 구현되어 있음예제와 사용 설명서가 잘 되어있음Regression, Clustering, Model Selection, preprocessing에 특화되어 있음딥러닝이나 강화학습을 다루지 않음그래픽 모델이나 시퀀스 예측 기능을

2022년 2월 14일
·
0개의 댓글
post-thumbnail

[혼공머신] 차원 축소의 주성분 분석 알고리즘

[혼자 공부하는 머신러닝+딥러닝] 책에 기반한 정리글입니다. 전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다. Github 링크 0. 개요 머신러닝 모델을 만들며 여러 이미지들을 저장할 때 저장공간이 부족할 수 있다. 이때 차원 축소 알고리즘을 사용하

2022년 2월 12일
·
0개의 댓글
post-thumbnail

[혼공머신] k-평균 알고리즘

혼자 공부하는 머신러닝+딥러닝 책에 기반한 정리글입니다.전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다.Github 링크저번 편에서 군집 알고리즘은 타깃값을 미리 알고 있었기 때문에 각 과일 사진의 픽셀의 평균을 구하는 것이 가능했지만, 진짜 비지도 학습

2022년 2월 10일
·
0개의 댓글
post-thumbnail

[혼공머신] 비지도 학습의 군집 알고리즘

혼자 공부하는 머신러닝+딥러닝 책에 기반한 정리글입니다.전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다.Github 링크비지도학습은 머신러닝의 한 종류로 훈련 데이터에 타깃이 없어, 외부의 도움 없이 스스로 학습해야 한다. 군집은 비슷한 샘플끼리 하나의

2022년 2월 10일
·
0개의 댓글
post-thumbnail

[혼공머신] 앙상블 학습 : 랜덤포레스트, 엑스트라트리, 그레이디언트 부스팅

앙상블 학습은 더 좋은 예측 결과를 만들기 위해 여러 개의 모델을 훈련하는 머신러닝 알고리즘이다.정형 데이터를 다루는 데 가장 뛰어난 성과를 내는 알고리즘이 바로 앙상블 학습이다. 이는 대부분 결정트리를 기반으로 만들어져 있다.이번 편에서는 앙상블 학습 알고리즘의 여러

2022년 2월 10일
·
0개의 댓글
post-thumbnail

[혼공머신] 교차검증, 그리드 서치

혼자 공부하는 머신러닝+딥러닝 책에 기반한 정리글입니다.전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다.Github 링크모델의 하이퍼파라미터 튜닝을 위해서 모델을 여러 번 평가해야 하는데, 일반화 성능을 올바르게 예측하려면 가급적 테스트 세트를 사용하지

2022년 2월 9일
·
0개의 댓글
post-thumbnail

[혼공머신] 결정트리와 불순도

[혼자 공부하는 머신러닝+딥러닝] 책에 기반한 정리글입니다. 전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다. Github 링크 0. 개요 >결정 트리는 예, 아니오에 대한 질문을 이어나가며 정답을 찾아 학습하는 알고리즘이다. >불순도는 결정 트리

2022년 1월 22일
·
0개의 댓글
post-thumbnail

[혼공머신] 확률적 경사 하강법

[혼자 공부하는 머신러닝+딥러닝] 책에 기반한 정리글입니다. 전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다. Github 링크 0. 개요 지금까지는 모델을 훈련할 때 훈련 데이터를 가지고 매번 모델을 새로 만들었다. 이번에는 훈련한 모델을 버리지 않

2022년 1월 22일
·
0개의 댓글
post-thumbnail

[혼공머신] 로지스틱 회귀와 시그모이드·소프트맥스 함수

깃허브 경로 : Self-Study/혼자-공부하는-머신러닝-딥러닝/혼자 공부하는 머신러닝+딥러닝 책에 기반한 정리글입니다.전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다.Github 링크로지스틱 회귀선형 방정식을 사용한 분류 알고리즘이다.시그모이드 함수나

2022년 1월 14일
·
0개의 댓글
post-thumbnail

[혼공머신] 다중회귀와 특성공학, 릿지·랏쏘 회귀

혼자 공부하는 머신러닝+딥러닝 책에 기반한 정리글입니다.전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다.Github 링크다중 회귀다중 회귀란 여러 개의 특성을 사용한 선형 회귀1개의 특성은 직선을, 2개의 특성은 평면을 학습특성이 많다면 매우 복잡한 모델

2022년 1월 13일
·
0개의 댓글
post-thumbnail

[혼공머신] 선형 회귀와 다항 회귀

혼자 공부하는 머신러닝+딥러닝 책에 기반한 정리글입니다.전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다.Github 링크저번 글에서 다른 k-최근접 이웃 회귀는 샘플과 가까운 이웃들의 평균으로 값을 예측하기 때문에, 샘플이 훈련세트의 범위를 벗어나면 엉뚱

2022년 1월 13일
·
0개의 댓글
post-thumbnail

[혼공머신] k-최근접 이웃 회귀

혼자 공부하는 머신러닝+딥러닝 책에 기반한 정리글입니다.전체 소스코드는 아래 Github 링크에서 확인할 수 있습니다.Github 링크이번 포스팅에서는 회귀를 이해하고 k-최근접 이웃 회귀에 대해 알아본다. 회귀임의의 어떤 숫자를 예측하는 문제k-최근접 이웃 회귀예측하

2022년 1월 13일
·
0개의 댓글

데이터 분류_02

앞에서 연습했던 Iris 품종 분류와 같이 데이터 분류에 대해서 계속 공부해보자 데이터 분류_01 scikit-learn의 예제 데이터를 활용한다 데이터셋 : 사이킷런 toy datasets load_digits : 손글씨 이미지 데이터 (링크) load_wine

2022년 1월 12일
·
0개의 댓글