In-context Leaning이란?

정확한 정의 : 사전 학습과 미세 조정을 결합하는 동시에 학습 프로세스 중에 작업별 지침이나 프롬프트를 통합하는 새로운 접근 방식입니다. 모델은 주어진 지침에 따라 상황에 맞는 응답 또는 출력을 생성하는 방법을 학습하여 특정 작업에 대한 성능을 향상시킵니다.ICL의 핵

2023년 9월 2일
·
0개의 댓글
·

Pre-training과 init_weight

사전 훈련은 자연어 처리나 컴퓨터 비전 등 다양한 분야에서 사용되는 기계 학습 기술입니다. 이는 큰 데이터셋에서 모델을 훈련하여 데이터의 기반 구조를 포착하는 일반적인 패턴과 표현을 학습하는 과정입니다. 사전 훈련된 모델은 입력 데이터로부터 의미 있는 특징이나 임베딩을

2023년 8월 18일
·
0개의 댓글
·
post-thumbnail

Transformer가 나오기 까지의 Step by Step

Notice!본 글은 medium블로그에서 Yule Wang, PhD 의 글인 Step-by-Step Illustrated Explanations of Transformer글을 번역과 함께 개인적인 해석이 들어간 포스팅입니다. 배우는 입장인지라 틀린 부분이 있거나 잘못

2023년 8월 12일
·
1개의 댓글
·
post-thumbnail

Multi-head attnetion (1)

self-attention block이 무수히 있는 block으로 아래의 그림처럼 self-attention을 알아야만 이해가 가능하다. (여기서 self-attention이란 Scaled Dot-product Attnetion과 같은 개념이며 왜 Scaled Dot-

2023년 7월 24일
·
0개의 댓글
·

백준 14889 스타트와 링크 (Python / 파이썬)

본 글은 작성자가 직접 푼 코드를 바탕으로 Chat-GPT를 활용하여 포스팅한 글입니다.https://www.acmicpc.net/problem/14889오늘은 스타트링크에 다니는 사람들이 모여서 축구를 해보려고 한다. 축구는 평일 오후에 하고 의무 참석도 아

2023년 7월 18일
·
2개의 댓글
·

백준 1325 효율적인 해킹 (Python / 파이썬)

본 글은 작성자가 직접 푼 코드를 바탕으로 Chat-GPT를 활용하여 포스팅한 글입니다. https://www.acmicpc.net/problem/1325해커 김지민은 잘 알려진 어느 회사를 해킹하려고 한다. 이 회사는 N개의 컴퓨터로 이루어져 있다. 김지민은

2023년 7월 16일
·
0개의 댓글
·

백준 1926 그림 (Python / 파이썬)

본 글은 작성자가 직접 푼 코드를 바탕으로 Chat-GPT를 활용하여 포스팅한 글입니다.https://www.acmicpc.net/problem/1926어떤 큰 도화지에 그림이 그려져 있을 때, 그 그림의 개수와, 그 그림 중 넓이가 가장 넓은 것의 넓이를 출

2023년 7월 16일
·
0개의 댓글
·

백준 1065 한수 (Python / 파이썬)

본 글은 작성자가 직접 푼 코드를 바탕으로 Chat-GPT를 활용하여 포스팅한 글입니다.https://www.acmicpc.net/problem/1065 \[1065번: 한수어떤 양의 정수 X의 각 자리가 등차수열을 이룬다면, 그 수를 한수라고 한다. 등차수열

2023년 7월 16일
·
0개의 댓글
·
post-thumbnail

백준 1541 수 정렬하기 - 잃어버린 괄호 (Python / 파이썬)

문제 설명 https://www.acmicpc.net/problem/1541 1541번: 잃어버린 괄호 첫째 줄에 식이 주어진다. 식은 ‘0’~‘9’, ‘+’, 그리고 ‘-’만으로 이루어져 있고, 가장 처음과 마지막 문자는 숫자이다. 그리고 연속해서 두 개 이상의

2023년 5월 28일
·
0개의 댓글
·
post-thumbnail

[Paper Review] Specializing Smaller Language Models towards Multi-step Reasoning

Main Idea Large Language Model(LLM)의 퍼포먼스가 높아지면서 Small Language Model(SLM)가 할 수 없는 Task들이 점차 생겨나고 있다. 특히 Multi-step reasoning(복잡 논리 추론) in math probl

2023년 4월 15일
·
0개의 댓글
·