# Named Entity Recognition

Paper Review #6 - DeepKE: A Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population
Zhang, Ningyu, et al., "DeepKE: A Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population", arXiv preprint arXiv:2201.03335, 2022 수 많은 데이터 속에서 필요한 정보만을 추출하는 IE(Information Extraction) 기술이 발전을 거듭하고 있다. IE 기술의 발전에 따라 대규모의 Knowledge Base 역시 구축 되고 있는데, 지식 베이스는 현실 세게에서 지식 집약적인 업무에 많은 도움을 준다. 따라서 KBP(Knowledge Base Population) 또한 각광을 받고 있는 분야 중 하나인데, KBP라 함은 텍스트로부터 지식을 추출해 KB의 손실된 부분을 완성하는 작업이다. 원문에서 entity와 관계를 추출하고, 이것들을 KB에 연결시켜주는 IE 작업은 여기서도 용이하게 쓰이고 있다. Named Entity Rec
Named Entity Recognition with BiLSTM + CNN
이번 글에서는 여기서 사용한 데이터셋과 전처리를 이용하여 다른 모델을 만들어 볼 것이다. 이전에서는 BiLSTM을 이용했지만 이번에는 BiLSTM과 CNN을 동시에 이용하여 만들어보자. 이번 내용에서는 단어(Word)와 글자(Character)의 차이를 헷갈리지 않도록 조심하자. 여기서이미 1D CNN을 이용한 텍스트 분류를 진행했던 적이 있다. 이 내용을 잠시 가져와보면 이런 느낌이었다. 이번에는 단어 대신에
Named Entity Recognition with BiLSTM
이번에는 이전글의 두번째 버전으로 새로운 파일로 실습해보자. 이번글에서 실습으로 사용된 .csv 파일은 여기서 다운받을 수 있다. 코랩이나 주피터에서 사용할 경우 그 파일과 같은 디렉토리에 .csv파일이 위치할 수 있게 하자. 코랩이라면 이 파일을 업로드하면 된다. Packages 필요한 패키지들을 다운받아준 후, 방금 올린 .csv파일을 unzip해주자. Import Data 파일을 불러와 data안에 저장한다. Data Preprocessing 어떻게 생겼는지 확인해보자. 
Named Entity Recognition 개체명 인식
이번 글에서는 개체명 인식을 소개한다. 개체명 인식은 대표적인 시퀀스 레이블링 태스크에 속하는데, 시퀀스 레이블링이란 [x1, x2, x3, ... ,xn]에 대해서 [y1, y2, y3, ... ,yn]을 각각 부여하는 작업을 말한다. 아래 예제 파일을 미리 가져와보겠다. 각 단어에 대해 출력값이 있기 때문에 return_sequences = True를 꼭 설정해 주어야 한다. ![](https://images.velog.io/images/yelim421/post/44db0baa-0cd5-4676-b650-9f2b811c9371/