Machine learning packages, functions (3)

호진·2021년 10월 9일
0
post-thumbnail

핵심 패키지와 함수

scikit-learn

  • train_test_split()은 훈련 세트와 테스트 세트를 나누는 함수이다. test_size 매개변수로 나눌 비율을 지정할 수 있으며 기본 비율은 0.25이다.
    shuffle 매개변수로 훈련 세트와 테스트 세트로 나누기 전에 무작위로 섞을 여부를 결정할 수 있다. 기본값은 True이다. stratify 매개변수에 클래스 레이블이 담긴 배열을 전달하면 클래스 비율에 맞게 훈련 세트와 테스트 세트를 나눈다. 일반적으로 타깃 데이터를 매개변수로 넣는다.

  • kneighbors()는 k-최근접 이웃 객체의 메서드이다. 이 메서드는 입력한 데이터에 가장 가까운 이웃을 찾아 거리와 이웃 샘플의 인덱스를 반환한다.
    return_distance 매개변수를 False로 지정하면 이웃 샘플의 인덱스만 반환하고 거리는 반환하지 않는다. 이 매개변수의 기본값은 True이다.

profile
💭(。•̀ᴗ-)✧

0개의 댓글