[Machine Learning] 딥러닝(Deep Learning)과 머신러닝(Machine Learning)

EUN JY·2023년 11월 30일
1

Machine Learning

목록 보기
2/2

출처 : https://www.zendesk.kr/blog/machine-learning-and-deep-learning/

1. 딥러닝과 머신러닝

  • 모든 딥러닝은 머신러닝이지만, 모든 머신러닝이 딥러닝은 아님
  • 머신러닝 모델
    • 새로운 데이터가 유입됨에 따라 특정 기능을 수행하는 데 점점 능숙해지지만, 여전히 인간의 개입 필요
    • AI 알고리즘이 부정확한 예측을 반환하면 엔지니어가 개입해 조정
    • 알고리즘을 사용하여 데이터의 구문을 분석하고 해당 데이터에서 학습함
    • 학습한 내용에 따라 정보에 근거한 결정을 내림
  • 딥러닝 모델
    • 알고리즘이 자체 신경망을 통해 예측의 정확성 여부를 스스로 판단, 인간의 도움이 필요하지 않음
    • 알고리즘을 계층으로 구성하여 자체적으로 배우고 지능적인 결정을 내릴 수 있는 ‘인공 신경망’을 만듦
    • 인간과 가장 유사한 AI를 구동하는 것

손전등 예시

  • ‘어둡다’는 단어를 말하는 소리 신호를 인식하면 불이 켜지도록 손전등을 프로그래밍 할 수 있음
  • 딥러닝을 활용하면 ‘안보여’, ‘스위치가 안켜져’ 라고 말해도 손전등이 켜져야 한다는 것을 이해하게 됨

자연어 처리

  • 머신러닝과 딥러닝 모두 자연어 처리(NLP)를 강화하는 데 사용됨
  • 자연어 처리 : 컴퓨터가 텍스트와 음성을 이해할 수 있도록 하는 컴퓨터 과학의 한 분야
  • Amazon의 Alexa, Apple의 Siri

1-1. 머신러닝(Machine Learning)

  • 데이터를 분석하고 데이터로부터 학습한 다음, 학습한 것을 적용해 정보에 입각한 결정을 내리는 알고리즘을 포함하는 인공지능의 애플리케이션
  • 간단히 AI라고 불리는 이 기술은 자동화된 추천을 제공하는 서비스에서 널리 사용
  • 고객 서비스 분야의 AI 어플리케이션 대부분은 머신러닝 알고리즘 활용
    • 셀프 서비스를 촉진, 상담 생산성 향상, 워크플로우 안정성 향상
    • 알고리즘에 공급되는 데이터는 지속적으로 유입되는 고객으로부터 발생
    • 고객이 겪고 있는 문제와 전후상황을 AI 어플리케이션에 종합, 빠르고 정확한 예측이 이루어짐

작동원리

  • 주어진 데이터를 사용하여 기능을 수행, 시간이 지남에 따라 그 기능이 점차 향상되는 것을 의미

예시

  • 온디맨드 음악 스트리밍 서비스 (청취자의 선호 사항을 음악적 취향이 비슷한 다른 청취자와 연관시킴)

1-2. 딥러닝(Deep Learning)

  • 기계가 사람의 도움 없이도 정확한 결정을 내릴 수 있도록 해주는 프로그래밍 가능한 신경망
  • 알고리즘을 계층으로 구성하여 자체적으로 배우고 결정을 내릴 수 있는 ‘인공 신경망‘을 만듦
  • 표준 머신러닝 모델보다 뛰어난 학습 시스템 제공

작동원리

  • 인간이 결론을 내리는 방식과 유사한 논리 구조를 사용, 데이터를 지속적으로 분석하도록 설계되었음
  • 딥러닝 애플리케이션은 인공 신경망이라는 계층화된 알고리즘 구조를 사용
  • 인공 신경망의 설계는 인간 두뇌의 생물학적 신경망에서 영감을 얻음

예시

  • Google의 AlphaGo (특정 동작을 수행해야 할 시점을 알려주지 않아도 게임을 수행함)
  • Moises (머신러닝을 활용하여 노래 트랙을 분리 / Deezer가 개발한 소스 분리 알고리즘을 활용)
  • 이미지 검색 (이미지 분류는 심층 신경망에 의해 작동됨)
  • 음성 인식, 번역, 자율주행차 등에 활용

연구주제

  • 전자 기타 연주자를 위한 딥러닝 기반 이펙터 분류 시스템

Objective 본 연구는 음원 데이터 분류를 위한 딥러닝 모델을 활용해 초급 및 중급 전자 기타 연주자들에게 도움이 될 수 있는 전자 기타 이펙터 자동 분류 시스템을 제안한다.
Background 이펙터는 전자 기타에 연결해 음의 파형에 변화를 주어 소리를 변조시키는 장치이다. 시중에는 다양한 종류의 이펙터가 존재하고 같은 종류의 이펙터라 하더라도 변조의 정도가 다르다는 점 때문에 대부분의 초/중급 연주자에게는 많은 비용과 시간을 들여 이펙터를 구매하고 기능과 조합을 학습해야 한다는 어려움이 존재한다.
Method 이펙터를 Filter, Time, Drive, Modulation 총 4가지 계열로 분류한 뒤, Filter계열은 wah. Time계열은 reverb, delay. Drive계열은 overdrive, distortion, fuzz. Modulation계열은 chorus, phaser, flanger, tremolo로 총 11개의 이펙터를 선정했다. 학습 및 실험에 사용하기 위한 음원 데이터는 Sonar사의 Cakewalk DAW와 TH3 전자 기타 VSTi를 활용해 수집했다. 데이터 세트는 0옥타브 도부터 3옥타브 도까지 22개의 단일음을 4초씩 연주한 44K 단음 데이터와 약 8분 45초 길이의 Canon Rock 연주음 데이터를 4초씩 분할한 44K 복합음 데이터로 구성되어 있다. 데이터 전처리를 수행한 후, 2640개의 각 계열별 단일음 샘플과 15720개의 복합음 샘플, 총 18360개의 샘플을 계열별 이펙터 분류 모델 훈련에 사용하였다.

2. 머신러닝의 유형

2-1. 지도 학습

  • 정답이 있는 데이터를 제공하여 정답이 없는 데이터를 식별하는 방법을 가르침
  • 감독을 가장 많이 필요로 하는 유형
  • 컴퓨터에는 훈련 데이터와 데이터에 대응하는 모델이 제공됨
  • 데이터 과학자는 컴퓨터에 새로 공급된 데이터에 대해 컴퓨터의 정확한 응답을 확인, 부정확한 응답을 수정하여 이 프로세스를 감독함
  • 개와 고양이의 차이를 구분하는 방법
    • 컴퓨터 모델에 정답이 있는 데이터 세트를 주입 (명확하게 식별된 고양이와 개의 사진)
    • 시간이 지남에 따라 컴퓨터는 두 동물의 패턴을 인식하기 시작
    • 정답이 없는 데이터(미확인 사진)를 컴퓨터에 주입, 정확하게 식별하는 능력을 테스트함

2-2. 비지도 학습

  • 정답이 없는 데이터만 컴퓨터에 주입, 모델 스스로 패턴을 식별하도록 함
  • 결과가 어떻게 도출될지 확실하지 않은 경우 사용됨
  • 컴퓨터가 유사점이나 차이점을 바탕으로 데이터의 숨겨진 계층과 클러스터 데이터를 파헤침
  • 기업의 고객 세그먼트를 식별
    • 어떤 세그먼트가 존재하는지 파악할 수 없는 상태
    • 정답이 없는 입력 데이터를 비지도 학습 모델에 입력하여 고객 세그먼트 분류

2-3. 강화 학습

  • 모델이 자신의 행동에서 피드백을 사용해 학습하는 시행착오형 접근법
  • 컴퓨터가 데이터를 올바르게 이해/분류할 때 긍정적 피드백을 받고, 아닐 경우 부정적 피드백을 받음
  • 올바른 판단 수행 시 보상한다는 점에서, 단순히 확인/수정하는 지도 학습과 차별화됨
  • 대규모 데이터 세트와 함께 수반되는 복잡한 작업을 기계가 마스터해야 할 때 사용
  • 자동차 운전
    • 수많은 시행착오를 통해 다단계 프로세스에 필요한 일련의 결정을 내리는 방법을 배움

3. 딥러닝의 유형

  • 심층 신경망은 인간의 뇌를 본떠 훨씬 정교한 수준의 인공지능임

3-1. 합성곱 신경망(CNN)

  • 이미지 처리와 개체 감지를 위해 설계된 알고리즘
  • 합성곱 : 이미지 내 모든 요소를 평가하기 위해 이미지를 필터링하는 고유의 프로세스
  • 컴퓨터 비전(기계에 시각적 세계를 처리하는 방법을 학습시키는 AI 분야)을 강화하는 데 사용됨
  • 컴퓨터 비전의 종류 : 안면 인식 기술

3-2. 순환 신경망(RNN)

  • 알고리즘이 과거 데이터 포인트를 기억하도록 하는 피드백 루프가 내장
  • 과거 이벤트에 대한 메모리를 사용해 현재 사건에 대한 이해, 미래 예측을 수행할 수 있음
  • 순환 신경망으로 수동되는 지도 앱은 교통체증 심화 시간대를 기억할 수 있음
    • 이 지식을 사용해 혼잡 시간대일 경우 대체 경로를 추천함
profile
개린이

0개의 댓글