6주 동안 실전 프로젝트를 진행하면서 학습한 내용을 기록하고, 팀의 리더로서 프로젝트 매니징 경험을 기록하는 시리즈입니다.
⇒ 데이터가 너무 많아서 이러한 방식으로는 시간이 너무 오래 걸릴 것이라 판단하였습니다.
⇒ 다운로드를 할 때 URL로 Payload를 담아서 Post 요청을 하면 xls파일을 반환합니다.
Kipris에서 받아온 데이터 ⇒ 불필요한 부분(1행~7행)은 자바의 poi 라이브러리를 이용해 제거
csv 데이터를 키바나에 업로드하면 파싱 에러 발생하였습니다.
csv 데이터는 콤마(,)를 구분자로 데이터 항목들을 구분하는데, 받아온 특허 데이터 안에 콤마(,)나 인용문(” “)이 포함되어 있어서 제대로 변환되지 않았습니다.
콤마(,)와 인용문("")을 따로 처리하는 코드를 추가하였습니다.
data.append("\""+cell.getStringCellValue()+"\""+",");
⇒ 전체를 “ “
로 감싸준다.
data.append("\"").append(cell.getStringCellValue().replaceAll("\"", "\"\"")).append("\",");
⇒ “ “”인용문“” “
처럼 쌍따옴표를 한번 더 감싸주고 전체를 다시 감싸준다.
⇒ 많은 시간이 소요되고 비효율적인 방법이라 판단하여 해외 데이터는 실제 데이터를 보내는 로그스태시 서버(데이터 파이프라인 서버)에서 수집하였습니다.