profile
ML/DL swimmer
태그 목록
전체보기 (53)ADsP(10)turing test(2)Optuna(2)LDA(2)missing value(1)결측값처리(1)augmentation(1)데이터마트(1)NFC(1)ANA(1)Layer Normalization(1)DecisionTreeRegressor(1)온도(1)ConfusionMatrix(1)Date(1)csv(1)em(1)F통계량(1)향상도(1)GloVe(1)CMMI(1)silhouette coefficent(1)HUSE(1)Label Smoothing(1)dataframe(1)Random Forest(1)humanness(1)feature map(1)reformer(1)GIS(1)Fast NMS(1)fasttext(1)군집분석(1)Shuffle split cross validation(1)XAI(1)feature generation(1)Incremental PCA(1)이상치처리(1)recall(1)배깅(1)scatter(1)BCEWithLogitLoss(1)GPT(1)include_bias(1)last_hidden_state(1)python-basic(1)categorical variables(1)LOOCV(1)Pivot(1)np.arrange(1)aic(1)kiwi(1)결측치(1)num_sanity_val_steps(1)target encoding(1)keras.preprocessing(1)주제 다양도(1)표본추출(1)AI Hub(1)Object Detection(1)NMF(1)AI교육(1)Seq2Seq(1)completeness(1)언어모형(1)데이터마이닝(1)열생성(1)feature scaling(1)다중공선성(1)merge(1)히스토그램(1)colab file import(1)v-measure(1)STFT(1)Regularization(1)stack(1)자기상관(1)konlpy(1)bert 예측 모델(1)word2vec(1)LGBMRegressor(1)ViT(1)interaction_only(1)PolynomialFeatures(1)One stage(1)colab 한글 인식 오류(1)GANalyze(1)blender(1)InteractionFeatures(1)linear_regression(1)ESD(1)top-k(1)CRM(1)OLTP(1)softmax(1)joblib(1)데이터레이크(1)분해시계열(1)산업안전(1)Filtering(1)Indexing(1)mask rcnn(1)KLD(1)CLS(1)요인분석(1)melt(1)Regression(1)feature selection(1)엔트로피지수(1)dikw(1)cross_val_score(1)precision(1)Two stage(1)k-평균 군집분석(1)meena(1)pickle(1)homogeneity(1)t 분포(1)JOIN(1)신뢰도(1)OLAP(1)engagingness(1)set_option(1)torch(1)klue-bert(1)SOM(1)f1 score(1)데이터거버넌스(1)skip gram(1)Odds(1)LSTM(1)kaggle(1)top-p(1)제1종오류(1)역변역(1)parse error(1)cart(1)Swin Transformer(1)decoding(1)인공지능강의(1)데이터표준화(1)dictionary(1)지능형CCTV(1)전이학습(1)NNLM(1)Gradient Accumulation(1)연관분석(1)Mel-spectogram(1)부스팅(1)민감도(1)Bayesian Optimization(1)Perplexity(1)공분산(1)n_fft(1)np.r_(1)이항분포(1)LSA(1)PMI(1)transformer(1)빅데이터분석방법론(1)stanza(1)outlier(1)PCA(1)nested structure(1)BCEWithLogitsLoss(1)back translation(1)warnings(1)bic(1)concat(1)ARIMA(1)SVD(1)pseudo labeling(1)PRcurve(1)디코딩(1)자연어처리(1)하이퍼파라미터(1)pytorch lightning(1)hop_length(1)filter(1)bootstrap(1)지지도(1)데이터웨어하우스(1)BERT(1)YOLACT(1)XGBoost(1)regex(1)One-Hot Encoding(1)ssa(1)f string(1)impute(1)Attention(1)String(1)텍스트 데이터 증강(1)Label Encoding(1)config(1)GPT2Model(1)key(1)로지스틱회귀(1)np.random(1)베르누이(1)다중선형회귀(1)weight decaying(1)이상치(1)value(1)ELIZA(1)특이도(1)지니지수(1)CRISP-DM(1)pam(1)ReLU(1)시계열분석(1)nbextension(1)roc auc(1)box(1)회귀분석(1)encoding(1)sample-and-rank(1)LM(1)groupby(1)contour(1)3V(1)linformer(1)GC(1)batch normalizaion(1)longformer(1)decision trre(1)랜덤포레스트(1)LightGBM(1)k-means(1)retriever(1)txt(1)의사결정나무(1)TTA(1)mecab-ko(1)ARMA(1)np.where(1)Grad-CAM(1)MFCCs(1)meshgrid(1)catboost(1)np.c_(1)KDD(1)process_input(1)R(1)segmentation(1)주제 응집도(1)등분산성(1)YOLO(1)열선택(1)단어임베딩(1)np.sort(1)베이지안최적화(1)R-square(1)EDA(1)Embedding(1)excel(1)Map(1)dw(1)N-Gram(1)CBOW(1)주성분분석(1)

[TIL] TORCH.TENSOR.SCATTER_

헷갈렸던 torch scatter 함수 이해를 위해 정리해본다. torch 공식 문서에는 scatter 에 대해 아래와 같이 나와있다. Parameters:dim (int) – the axis along which to indexindex (LongTensor) – t

2023년 5월 12일
·
0개의 댓글
·

[TIL] Feature Generation

1. 이게 어째서 1D AutoEncoder지? > AutoEncoder 클래스에서는 input 데이터가 1차원 벡터로 가정되어 있기 때문에 1D AutoEncoder라고 부릅니다. 이를 확인할 수 있는 부분은 레이어의 input dimension이 30으로 고정되

2023년 5월 9일
·
0개의 댓글
·

[TIL] Keras functions

위 코드는 프로파일 이미지와 귀 이미지를 로드하여 전처리하는 코드입니다. 먼저 profile_images와 ear_images 리스트를 생성하고, 반복문을 사용하여 1부터 60까지의 이미지 파일을 로드하여 각 리스트에 추가합니다. tf.keras.preprocessin

2023년 5월 8일
·
0개의 댓글
·

[TIL] Audio data Representation

1. nfft와 hoplength가 무엇을 의미하지? > 와 는 오디오 신호 분석을 위한 매개변수입니다. 는 STFT(short-time Fourier transform)에 사용되는 FFT(fast Fourier transform)의 크기를 결정합니다. FFT는 주

2023년 5월 8일
·
0개의 댓글
·

[TIL] Pytorch Config

Box는 dict를 object처럼 사용할 수 있게 해주는 라이브러리입니다. dict에서 key로만 접근하는 것이 아니라, attribute로도 접근할 수 있게 해줍니다. 이렇게 attribute로 접근하면, 해당 attribute가 없을 때 에러가 발생하는 대신 No

2023년 5월 8일
·
0개의 댓글
·

자연어 처리에서 데이터 증강 방법

단어 바꾸기문장에서 단어를 골라 유의어 사전이나 단어 임베딩을 이용해 유의어로 교체TF-IDF 점수가 낮은 단어로 교체 역변역(Back translation) 문장을 다른 언어로 번역 후, 원래의 언어로 다시 번역 의미를 보존하면서 표현을 바꿀 수 있음텍스트 표층 변

2023년 4월 8일
·
0개의 댓글
·
post-thumbnail

챗봇 평가 방법

사람에 의한 평가 (Turing Test)생각할 수 있는 능력에 대한 테스트로는 문제가 있음짧은 시간 동안의 대화에서 인간 평가자를 속이기는 쉬움평가자 간의 차이, 시간과 비용, 다양성에 대해 평가혼란도(perplexity) (e.g. 혼란도 2라면 한 단어마다 2개

2023년 4월 6일
·
0개의 댓글
·
post-thumbnail

[Kaggle] 반려동물 사진 인기도 예측 연구(1)

캐글 2021년 경진대회인 PetFinder.my - Pawpularity Contest 를 바탕으로 딥러닝 기반 컴퓨터 비전 연구 프로젝트를 진행한 내용을 정리하고자 한다. 아래 내용은 연구 기획 단계인 중간 발표 자료이다. 이미 종료된 Competition을 기반으

2023년 3월 29일
·
0개의 댓글
·
post-thumbnail

건설현장 작업자 안전관리 AI 솔루션 연구

대학원 과정에서 진행한 딥러닝 활용 인공지능 연구제안 프로젝트 내용을 복기하는 차원에서 작성해보고자 한다. 부족한 부분이 많은 프로젝트였지만 스스로 사례를 찾아보면서 문제에 어떻게 접근해야하는지 감을 잠을 수 있었던 경험이었다. 해당 프로젝트는 주제 선정, 선행 연구,

2023년 3월 25일
·
0개의 댓글
·

Decoding and GPT

인코더와 디코더트랜스포머는 Seq2Seq 모형 (입력 시퀀스 → 출력 시퀀스)인코더 : 입력 시퀀스를 처리하는 부분(양방향 attention), 문장의 의미 이해디코더 : 출력 시퀀스를 처리하는 부분(단방향 attention), 새로운 문장 생성GPT : OpenAI에

2023년 3월 24일
·
0개의 댓글
·
post-thumbnail

AI HUB 에세이 글 평가 데이터 Bert 예측 모델 만들기(2)

이전 글에 이어서 데이터 전처리와 모델링 과정을 정리하고자 한다. 4. 데이터 전처리 json파일로부터 필요한 데이터를 가져와 train, test에 넣어주었다. 데이터 전처리는 train, test 구분 없이 한번에 처리하기 위해 temp로 합쳤다. 나중에 학습할

2023년 1월 24일
·
13개의 댓글
·
post-thumbnail

트랜스포머(Transformer)

개념주의 메커니즘만을 사용한 Seq2Seq 모형(like 번역기, 챗봇)문장 내, 문장 간 주의 메커니즘 적용모델 구조 Query-Key-Value하나의 입력값을 Query, Key, Value 세 가지 값으로 변환사전 검색과 비슷Query(질의, 검색어)와 비슷한

2023년 1월 23일
·
0개의 댓글
·
post-thumbnail

언어 모형(Language Model)

확률의 연쇄 규칙 $P(x_1, x_2) = P(x_2|x_1)P(x_1)$ 인과적 언어 모형(=언어모형) : 조건부 확률 형태의 언어 모형 $P(xn|x_1, x_2, …, x{n-1})$ 인공신경망 등의 모형으로 구현하기 쉬움단어를 순서대로 생성할 수 있음n-

2023년 1월 14일
·
0개의 댓글
·
post-thumbnail

AI HUB 에세이 글 평가 데이터 Bert 예측 모델 만들기(1)

AI HUB 에세이 글 평가 데이터를 활용하여 간단한 score 예측 모델을 만들어 보고자 한다. 에세이 글 데이터에는 초등/중등/고등학생 전학년의 글들이 있으며, 11종의 세부 평가지표에 따른 점수와 관련 메타 데이터가 존재한다. AI HUB에 공개된 AI 모델

2023년 1월 13일
·
0개의 댓글
·
post-thumbnail

자연어 처리

자연어 처리의 분야 2가지자연어 이해(듣기, 읽기) : 문서 분류, 토큰 분류, 문서 유사도, 질의 응답자연어 쓰기(말하기, 쓰기) : 다음 단어 예측, 빈 칸 채우기, 요약, 번역자연어 생성의 방법규칙 기반 (e.g. 일기예보)장점: 자연어 생성의 각 과정을 세세하게

2023년 1월 13일
·
0개의 댓글
·
post-thumbnail

인공지능 강의 기록

<인공지능과 수학> 오픈 교실 (한일여자고등학교)

2023년 1월 9일
·
0개의 댓글
·
post-thumbnail

주제 다양도(topic diversity)

LDA와 같은 주제분석을 할 때 평가를 위한 지표로 Perplexity, 주제 응집도, 주제 다양도 등이 있다. (관련 내용에 대한 이전 블로그 글)주제 응집도는 주제를 구성하는 단어들이 서로 연관된 정도를 측정하는 것이 목적이다. 즉, 한 주제에 대해서 단어들이 얼마

2022년 12월 31일
·
0개의 댓글
·
post-thumbnail

단어 임베딩

단어 임베딩 : 단어를 낮은 차원의 벡터로 나타내는 것원핫 인코딩은 sparse, 용량 많이 차지, 단어 의미 고려 안함단어의 의미를 좌표로 나타내는 것 또는 수치화 → 의미가 비슷한 단어들은 비슷한 값을 가짐단어 임베딩의 다차원 공간상에서 방향에 의미가 있어야 함단어

2022년 12월 30일
·
0개의 댓글
·

Regularization

early stoppingdropoutweight decayingL1 : 가중치를 0으로 만드는 경향L2 : 매끄럽게.. 소극적 반영L1L2batch normalization : 틀에 맞춘다.. → regularization(억제) 효과서로 다른 크기를 같은 scale

2022년 12월 19일
·
0개의 댓글
·
post-thumbnail

주제 분석(Topic Analysis)

주제 분석의 방법 중 행렬 분해에 의한 방법과 확률 분포에 의한 방법이 있다. 그 중 행렬 분해애 의한 방법은 크게 LSA(Latent Semantic Analysis)와 NMF(Non-Negative Factorization)로 나눌 수 있다. LSA는 잠재 의미를

2022년 12월 16일
·
0개의 댓글
·