profile
Graduate School of DataScience, NLP researcher
post-thumbnail

[kubernetes in action] WSL에 minikube 설치하기

wsl에 minikube 설치하기

2022년 5월 20일
·
0개의 댓글
post-thumbnail

WSL2 ubuntu 환경에 anaconda 설치하기

wsl2의 ubuntu 20.04 환경에 anaconda 설치 후 환경변수 설정하기

2022년 3월 6일
·
0개의 댓글
post-thumbnail

HuggingFace Tokenizer [unused01] 토큰 사용하기

허깅페이스 토크나이저의 unused01 토큰 사용하기

2021년 11월 20일
·
0개의 댓글
post-thumbnail

PyTorch Dataset 구축 방식 시간 비교 (List형 vs Dict형)

Torch Dataset을 구축할 때, 각 샘플을 Dict형과 List형으로 저장할 때의 시간 비교

2021년 9월 18일
·
0개의 댓글

처음 써보는 면접 후기

부끄럽고 자괴감이 많이 들었지만 부족했던 부분과 면접 자리에서 대답이 아쉬웠던 질문들을 기억해두기 위한 기록.내가 AI/ML 엔지니어로서 가질 수 있는 강점?AI/ML 모델 기본기. 단지 도메인 specific한 공부만 한 게 아니라 모델의 학습 원리와 과정에 대해서도

2021년 9월 15일
·
0개의 댓글
post-thumbnail

[해커랭크] Roads and Libraries, 각 싸이클마다 도서관이 하나씩 들어가게 하는 비용

DFS 문제이면서 cycle 개념과 수학적인 비용 계산이 포함된 좋은 문제

2021년 9월 7일
·
0개의 댓글
post-thumbnail

[boj1679] 숫자놀이. DFS, DP, itertools 모두 학습이 가능한 문제

DFS, DP, itertools를 모두 활용해 볼 수 있는 좋은 문제

2021년 8월 26일
·
0개의 댓글
post-thumbnail

[boj1148] word A의 알파벳으로 word B를 만들 수 있니? Counter로 비교하기

백준 1148 단어 만들기 word1의 알파벳들로 word2를 만들 수 있을까? Counter를 만들어서 두 단어 비교해보기

2021년 8월 25일
·
0개의 댓글
post-thumbnail

[Research] Word2Vec으로 쇼핑 리뷰 속 유사한 의미를 갖는 단어들을 찾아보자-2

W2V의 Skipgram 방식으로 상품군별 쇼핑리뷰 corpus를 학습시키고, aspect seed와 유사한 단어들을 추출해내는 과정

2021년 8월 23일
·
0개의 댓글
post-thumbnail

[Research] Word2Vec으로 corpus 속 유사한 의미를 갖는 단어들을 찾아보자-1

aspect seed에서 aspect words를 뽑아내기 위해 W2V skipgram을 사용한다. 여기서는 W2V 방식에 대한 설명

2021년 8월 23일
·
0개의 댓글
post-thumbnail

[Codility] Recursion과 nonlocal을 활용한 magicSquare 풀이

nonlocal 변수와 recursion을 사용해보기 (DFS 등을 풀 때 매우 유용)

2021년 8월 21일
·
0개의 댓글
post-thumbnail

[Codility] Stack을 활용해서 주어진 벽 모양 속의 직사각형 개수 세기

Stack을 활용해서 사각형의 면적과 관련된 문제를 푼다. 코드로만 보면 이해가 힘들 것 같아서 그림으로 메모해둔다.

2021년 8월 20일
·
0개의 댓글
post-thumbnail

[Research] 리뷰에서 Aspect word가 될 만한 후보군을 통계적으로 추출해보기

Khaiii로 토크나이즈하고 TF-IDF와 유사한 형태의 함수를 커스터마이징 하여 리뷰 속 주요 단어(aspect seed)를 뽑아내는 작업을 해보았다.

2021년 8월 18일
·
0개의 댓글
post-thumbnail

[Research] Khaiii 토크나이저를 활용한 리뷰 데이터셋 구축 - 2. 전처리

한국어 리뷰로 Aspect Extraction을 위한 데이터셋을 구축하는 과정 - 전처리

2021년 8월 18일
·
0개의 댓글
post-thumbnail

[boj3944] int(digits, n). n진법 수 변환하기

n진법 수를 int type의 10진법 수로 변환하기. int()

2021년 8월 18일
·
0개의 댓글
post-thumbnail

[Research] Khaiii 토크나이저를 활용한 리뷰 데이터셋 구축 - 1. Pipeline 계획

Khaiii를 활용해 리뷰 Aspect Extraction 데이터셋을 직접 구축하기 위한 계획

2021년 8월 17일
·
0개의 댓글
post-thumbnail

[Research] Review에서 주요 단어를 추출하기 가장 좋은 tokenizer는 무엇일까

리뷰 데이터에서 aspect를 추출하는 task에 어떤 한국어 토크나이저가 적합할지 비교해보았다.

2021년 8월 16일
·
0개의 댓글
post-thumbnail

[AiR_Predictor] 서울시 초미세먼지 예측 모델을 사용 가능한 프로그램으로 배포

이 글은 지난 6월 진행했던 초미세먼지 예측 모델(서울시 초미세먼지 예측 모델링 포스팅)을 실제 사용 가능한 프로그램으로 다듬어서 배포한 과정을 담고 있다.

2021년 8월 15일
·
0개의 댓글
post-thumbnail

[pgs단어 변환] Level 단위의 BFS(최단거리 구하기)

BFS로 최단 거리 구하기. (level 단위) DFS로 path 구하기 (재귀 호출 시 변수 고정)

2021년 8월 14일
·
0개의 댓글
post-thumbnail

[pgs_SQL] 하나의 내부 테이블은 괄호로 묶어주기

내부 SELECT FROM WHERE 쿼리는 괄호로 묶어줘야 내부 테이블인 것을 인식한다

2021년 8월 14일
·
0개의 댓글