나의 첫 머신러닝

01-1 인공지능과 머신러닝, 딥러닝

인공지능이란

사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술

  • 인공일반지능/강인공지능: 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템
  • 약인공지능: 사람을 도와주는 보조 역할

머신러닝이란

규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 찾아 학습하는 알고리즘을 연구하는 분야

딥러닝이란

머신러닝 알고리즘 중에 인공신경망(Artificial Neural Network)을 기반으로 한 방법들을 통칭

인공신경망이란

생물의 신경망(특히 뇌)에서 영감을 얻은 알고리즘이다.

01-2 코랩과 주피터 노트북

구글 코랩

구글 클라우드 기반 주피터 노트북 개발 환경
셀단위로 실행됨
1. 텍스트 셀
2. 코드 셀

노트북

구글 클라우드의 가상 서버로 12기가 RAM, 100기가 디스크 사용 가능!

01-3 마켓과 머신러닝

생선 분류 문제

  • 사용 모델: sckit-learn.KNeighborsClassifier
  • 목표: 도미와 빙어의 길이, 무게 데이터가 있을 때, 도미와 빙어를 분류하기

1. 데이터 전처리

# source data processing
fish_length = bream_length + smelt_length
fish_weight = bream_weight + smelt_weight
fish_list = zip ( fish_length, fish_weight )
fish_data = [ [ l, w ] for l, w in fish_list ]
print ( fish_data )
>
#target data processing
fish_target = [1] * 35 + [0] * 14
print ( fish_target )
  • 2차원 리스트

2. 모델 훈련

from sklearn.neighbors import KNeighborsClassifier
kn = KNeighborsClassifier()
kn.fit( fish_data, fish_target )
kn.score( fish_data, fish_target )

  • n_neighbors: KNeighborsClassifier의 parameter. 참고 데이터의 갯수를 정할 수 있다.
    예) KNeighborsClassifier(n_neighbors = n)

코랩 링크

profile
그냥 사람

0개의 댓글

Powered by GraphCDN, the GraphQL CDN