딥러닝 Deeplearning 1

Bleu·2023년 10월 11일

note python

python

목록 보기

17/22

인공지능 (AI - Artificial Intelligence)
- 지능: 어떤 문제를 해결하기 위한 지적 활동 능력
- 인공지능
  - 기계가 사람의 지능을 모방하게 하는 기술
  - 규칙기반, 데이터 학습 기반

Strong AI (강 인공지능) vs Weak AI (약 인공지능)

Artificial General Intelligence (AGI)
- 인간이 할 수 있는 모든 지적인 업무를 해낼 수 있는 (가상적인) 기계의 지능을 말한다. 인공지능 연구의 주요 목표.
Strong AI (강 인공지능)
- AGI 성능을 가지는 인공지능
- 인공지능 연구가 목표하는 방향.
Weak AI (약 인공지능)
- 기존에 인간은 쉽게 해결할 수 있었지만 컴퓨터로 처리하기 어려웠던 일을 컴퓨터가 수행할 수 있도록 하는 것이 목적.
- 지각(知覺)을 가지고 있지 않으며 특정한 업무를 처리하는데 집중한다.

인공지능의 발전을 가능하게 만든 세가지 요소

데이터의 급격한 증가
- 디지털사진, 동영상, IoT 기기, SNS 컨텐츠 등으로 인해 데이터가 폭발적으로 증가
- 전 세계 디지털데이터의 90%가 최근 2년 동안 생성
알고리즘의 발전
- 급증한 데이터를 이용한 기존 알고리즘 개선 및 새로운 알고리즘들이 개발됨.
컴퓨터 하드웨어의 발전
- CPU와 GPU의 발전.
- 특히 GPU의 발전은 딥러닝의 발전으로 이어짐.
- TPU(Tensor Processing Unit)
  - 구글에서 개발한 딥러닝 전용 칩셋

머신러닝과 딥러닝

머신러닝(Machine Learning)

데이터 학습 기반의 인공 지능 분야
기계에게 어떻게 동작할지 일일이 코드로 명시하지 않고 데이터를 이용해 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 인공지능의 한분야

딥러닝 (Deep Learning)

인공신경망 알고리즘을 기반으로 하는 머신러닝의 한 분야. 비정형데이터(영상, 음성, 텍스트)에서 뛰어난 성능을 나타낸다. 단 학습 데이터의 양이 많아야 한다.

비정형 데이터

정해진 규칙 없이 저장되어 값의 의미나 특성을 쉽게 파악할 수 없는 데이터

텍스트, 영상, 음성 데이터가 대표적인 예이다.

정형 데이터

표(table)형태의 미리 정해 놓은 형식과 구조에 따라 저장되도록 구성된 데이터로 그 의미나 특성파악이 용이하다.

대표적이 예로 관계형 데이터베이스가 있다.

기존 프로그래밍 방식과 머신러닝 방식의 차이

기존 프로그래밍방식
- 알고리즘(규칙)을 사람이 생각한다.
머신러닝
- 알고리즘을 데이터를 학습시켜 찾아낸다

머신러닝 모델(알고리즘, 모형)

모델이란 데이터의 패턴을 수식화 한 함수를 말한다.
- 함수(Function)
  - 입력데이터와 출력데이터간의 관계
- 머신러닝은 입력데이터와 출력데이터를 이용해 그 둘의 관계 mapping에 근사한 함수를 찾는다.
- 그러나 처음에는 방대한 데이터에 대한 정확한 패턴을 알 수 없기 때문에 "이 데이터는 이런 패턴을 가졌을 것"이라고 가정한 함수(가설)를 정한 뒤 데이터를 학습시켜 데이터 패턴을 잘 표현하는(근사한) 함수를 만든다.

데이터 관련 용어

Feature

추론하기 위한 근거가 되는 값들을 표현하는 용어.

예측 하거나 분류해야 하는 데이터의 특성, 속성 값을 말한다.

입력 변수(Input), 독립변수라고도 한다.

일반적으로 X로 표현한다.

Label

예측하거나 분류해야 하는 값들을 표현하는 용어

출력 변수(Output), 종속변수, Target 이라고도 한다.

일반적으로 y로 표현한다.

데이터 포인트

하나의 데이터를 표현하는 용어.

딥러닝의 특징

기존 머신러닝과 딥러닝 알고리즘은 데이터를 학습시켜 알고리즘을 찾아낸다는 점에서는 동일하다.
학습을 통해 좋은 알고리즘을 찾기 위해서는 데이터로 부터 우리 목적에 맞는 특성들을 추출해 학습데이터를 잘 만들어야 한다.
- 원본 데이터(Raw) 에는 패턴을 찾는데 필요 없거나 방해되는 요소(Noise)들도 포함되 있다.
- 그래서 데이터 전처리를 통해 noise들을 제거하고 중요한 특성들만 찾아야 한다. 이런 작업을 데이터 전처리, Feature extraction 이라고 한다.
기존 머신러닝은 Feature 추출을 사람이 작업한다. 그리고 그 추출된 Feature vector로 부터 알고리즘을 찾아내는 것을 학습을 통해 자동으로 처리한다.
딥러닝은 feature 추출을 모델에 넣어 학습시 feature 추출과 알고리즘 찾는 작업을 동시에 한다.
그래서 딥러닝은 feature를 찾기 힘든 비정형데이터에서 좋은 성능을 나타낸다. Feature 추출이 용이한 정형데이터의 경우 기존 머신러닝 알고리즘이 좋은 성능을 보인다.

Bleu

다음 포스트

딥러닝 Deeplearning 1

python

인공지능 (AI - Artificial Intelligence)

Strong AI (강 인공지능) vs Weak AI (약 인공지능)

인공지능의 발전을 가능하게 만든 세가지 요소

머신러닝과 딥러닝

머신러닝(Machine Learning)

딥러닝 (Deep Learning)

기존 프로그래밍 방식과 머신러닝 방식의 차이

머신러닝 모델(알고리즘, 모형)

데이터 관련 용어

Feature

Label

데이터 포인트

딥러닝의 특징

딥러닝 Deeplearning 2

0개의 댓글