인간의 학습능력, 추론능력, 지각능력을 인공적으로 구현하는 기술
인간의 뇌에 존재하는 시냅스를 따라 AI의 파라미터를 생성하고, 파라미터가 많을수록 AI의 성능이 향상된다.
AI는 머신러닝(Machine Learning)과 딥러닝(Deep Learning)을 모두 포함한다.
컴퓨터가 명시적으로 프로그래밍되지 않아도 학습할 수 있는 능력을 갖추게 하는 알고리즘과 기술의 집합 (수학적 접근을 통한 문제 해결)
머신러닝은 딥러닝을 포함하는 범위를 가진다.
머신러닝의 3가지 학습
- 비지도 학습 : 정답 없이 문제해결 모델 제작
- 지도 학습 : 정답을 활용해서 문제해결 모델 제작
- 강화 학습 : 더 나은 방향으로 문제를 풀어가는 방법
인공 신경망(Artificial Neural Networks:ANN)을 기반으로 복잡한 비선형 문제를 해결하는 방법론
입력층(Input Layer), 다계층으로 구성된 은닉층(Hidden Layer), 출력층(Output Layer)으로 구성되어 있다.
※ Chat-gpt? 사전학습된 AI 모델
순전파(Foward Propagation)와 역전파(Back Propagation)를 통한 모델 학습과정
인공지능 모델 개발 과정
- 정형 데이터 : 구조화 된 형태로 값이 존재 (DB)
- 반정형 데이터 : 구조화된 형태지만, 연산이 불가 (xml, json 등)
- 비정형 데이터 : 형태가 없고, 연산이 불가 (영상, 음성파일 등)
Encoders-Decoders 형태로 구성된 구조
Self-attention과 Positional Encoding, 자연어 처리 성능 향상
셀프어텐션(Self-attention) : 단어와 단어 사이의 연관관계 학습
포지셔널 인코딩(Positional Encoding) : 단어의 순서와 위치정보를 학습