머신러닝

Goofi·2023년 11월 18일
0

머신러닝(=기계학습)

사람이 학습을 하듯이 기계를 학습시켜서 정확한 판단력을 갖게 한다는 점에서 이런 기술을 기계 학습이라고 한다.

모델

모델을 만드는 과정을 학습한다고 부른다.
모델을 잘만들면 좋은 추측을 할 수 있다.

사물인터넷

인터넷으로 사물을 조정할 수 있다.

티처블머신

https://teachablemachine.withgoogle.com/

데이터산업

현실을 변화시키는 산업을 데이터 산업
데이터과학데이터공학으로 분류 가능

데이터과학

데이터를 만들고 만들어진 데이터를 이용하는 것이다.
책에 비유하자면 작가이다.

즉, 데이터를 자체를 다룬다.

데이터공학

데이터를 다루는 도구를 만들고 도구를 관리하는 일을 한다.
책에 비유하자면 종이를 연필을 만들고 책을 잘 출판하고 그런 것이다.

즉, 데이터를 다루는 것을 도와주는 것이다.

독립변수

원인이 되는 열을 의미

표 특성

  • 온도와 판매량이 같이 커지고, 작아지고 있음을 발견했습니다.
  • 온도와 판매량 사이에 다른 영향을 줄 만한 특성이 발견되지 않았습니다.
  • 판매량이 달라지니 온도가 달라졌다. - 이상합니다.
  • 온도가 달라지니 판매량이 달라졌다. - 가능합니다.
  • 온도의 2배가 판매량이 되는 일정한 패턴이 발견됩니다.

종속변수

원인으로 인해 결과가 되는 열을 의미

총 정리

  • 독립변수는 원인이다.
  • 종속변수는 결과이다.
  • 독립변수와 종속변수의 관계를 인과관계라고 한다.
  • 인과관계는 상관관계에 포함된다.

예제


머신러닝(=기계학습)

지도학습(supervised learning)

기계를 가르친다는 의미이다.
즉, 학생을 가르치듯이 데이터로 컴퓨터를 학습시켜서 모델을 만드는 방식이다.

비유)지도학습은 역사와 비슷하다.
머신러닝의 지도학습을 하려면 데이터가 많아야 한다.

지도학습을 하기 위해서는 과거의 데이터가 있어야한다.
그 데이터를 독립변수와 종속변수를 분리해야한다.

좋은 모델이 되려면 데이터가 많을 수록 정확할수록 좋다.

회귀

회귀는 예측하고 싶은 종속변수가 숫자일때는 회귀라는 머신러닝을 사용한다.

1월8일의 형태의 데이터는 숫자이다. 이럴 때 회귀이다.
예측하고 싶은 결과가 숫자라면
지도학습의 해귀로 해결해주세요 전문가한테 말하면 된다.

회귀에 좋은 사례

분류


결과가 숫자가 아니라면 분류를 사용한다.
이럴땐 회귀를 사용하지 않는다.
전문가에겐 지도학스에게 분류로 해결해주세요라고 하면된다.

결론

  • 가지고 있는 데이터에 독립변수와 종속변수가 있고 종속변수가 숫자일 때 회귀를 이용하면 됩니다.
  • 가지고 있는 데이터에 독립변수와 종속변수가 있고, 종속변수가 이름일 때 분류를 이용하면 된다.

비지도학습(unsupervised learning)

군집화(clustering)

비슷한 것들을 찾아서 그룹을 만드는 것이다.
비지도학습은 데이터의 성격을 파악하는게 중요하다.

군집화vs 분류
집이 마구 어지럽혀 있다. 비슷한 것들끼리 그룹을 만드는것이 군집화이다.
그룹을 만들고 난 후에는 각각의 물건을 적당한 그룹을 위치할 것이다.

결론

비슷한 행을 그룹핑하는 것 → 군집화

변환

까치밥

연관 = 연관 규칙 학습

관측지를 그룹핑 해주는것 - 군집화

특성을 그룹핑 해주는것 - 연관규칙

강화학습

지도학습이랑 비슷하지만 지도학습이 정답을 알려주는 문제집이 알려주는 거라면 강화학습은 어떻게 하는 것이 더 좋은 결과를 낼 수 있는지를 스스로 느낄수 있는지를 실력향상을 위해 노력하는 것이다.
ex) 게임실력을 키우는 것이다.

결론

정답이 있는 문제를 해결하는 것은 무엇인가요?
→ 지도학습
무언가에 대한 관찰을 통해 새로운 의미나 관계를 밝혀내는 것은 무엇인가요?
→ 비지도학습
더 좋은 보상을 받기 위해서 수련하는 것은 무엇인가요?
→ 강화학습

결론

상태에 따라서 더 많은 보상을 받을 수 있는 행동을 에이전트가 할 수 있도
록 정책을 만드는게 목적이다.

업로드중..

profile
오늘보단 내일이 강한 개발자입니다!!🧑🏻‍💻

0개의 댓글