6주 동안 실전 프로젝트를 진행하면서 학습한 내용을 기록하고, 팀의 리더로서 프로젝트 매니징 경험을 기록하는 시리즈입니다.
레시피 실 데이터 7500만 건을 어떻게 모으지!?🤔
기존 프로젝트(Coogle)의 데이터 생성 및 수집 전략은 다음과 같았다.
1) 유저가 게시글 작성을 통해 등록한 레시피
2) '만개의 레시피' 크롤링 184,000건
3) 더미 데이터 생성
우리 팀은 기획 단계에서부터 데이터 효용성을 고려하지 않았고 3번을 주력 전략으로 삼아 목표 데이터(7500만 건)를 수집하려고 했었다.
하지만 1차 멘토링 이후 데이터의 효용성에 대한 논의가 나왔다.
의견 1) 효용성 있는 실 데이터를 모으기 위해서는 기획 변경 해야 한다.
의견 2) 레시피 검색 서비스에서는 현재 우리가 가지고 있는 더미 데이터도 효용성이 있다고 생각한다. 기존 기획을 그대로 가지고 가도 된다고 생각한다.
결론
더미 데이터는 효용성이 없다.
기존 기획에서 우리가 목표하는 만큼의 실 데이터를 모으기 위해서는 사이트마다 크롤링을 해야 한다.
- 네이버 블로그의 경우, 글(레시피) 작성 방식이 정해져 있지 않기 때문에 크롤링으로 데이터 모으기 까다롭다.
- 구글에 '레시피 사이트' 검색하면 나오는 레시피 탭 형식으로?
- 만개의 레시피, 우리의 식탁, 외국 사이트 등 크롤링 하는 데 모든 시간을 다 쓸 것 같다. 심지어 그렇게 크롤링을 다 해도 7500만 건을 모을 수 있을 지 미지수.
레시피 검색 서비스에서 더미 데이터 생성 이외의 전략으로는 우리가 목표하는 만큼의 실 데이터를 모으기 어렵다.
⇒ 장시간의 논의 끝에 기획을 변경으로 의견 합치.
그리고 기존 프로젝트는 중단되었다. 일주일 동안 많이 애정했던 Coogle 안녕..✨
의견 1) 검색 기능 자체가 MVP. 더 부가적인 서비스를 고민하기 보다는 데이터를 모으고 유저에게 보여주는 데 집중해야 한다.
의견 2) 기존 서비스보다 서비스 면에서 더 가치 있는 부분이 있어야 한다.
결론
레퍼런스 사이트들을 보라! 검색 기능 그 자체가 MVP 기능이다. 부가 서비스들은 추후 논의할 문제!
기존 서비스를 사용할 때 불편한 점이 무엇일지 고민해보고 이를 개선하는 것을 우리 서비스의 핵심 가치로 삼자!
특허 검색 서비스
개발하고 싶은 여러 아이디어가 떠오르는데, 기획이나 개발 단계에 착수하기 전에 이미 동일한 제품이 있는지 특허를 확인하여 중복 투자 및 중복 연구를 예방하는 과정이 필수적이다.
대국민 특허정보검색서비스 KIPRIS에 들어가서 검색을 해보자
키프리스 서비스를 사용해보고 느낀점
[특허실용신안] 탭에서 '조명'을 검색해봤더니 결과가 너무 복잡하다..😮
키프리스에서는 매년 상/하반기에 이용실태 및 만족도 조사를 진행하고, 의견 수렴 등을 통해 서비스를 개선해 나가고 있다. 그리고 그 결과로 지금의 서비스가 완성되었을 것이다. 현재 키프리스가 보유한 모든 서비스는 전문가(변리사)나 특허검색에 능통한 사람들이 사용하기에는 유용할 것이라 생각한다.
하지만 초보자에게는 한 페이지에 담긴 정보와 서비스가 너무 많아서 부담스럽고 오히려 특허검색을 더 복잡하게 만드는 문제가 있었다.
키프리스는 초보자를 위한 초보자 검색 서비스도 제공한다. 하지만 키워드랑 연산자를 조합해야만 구체적인 검색을 할 수 있는 복잡한 검색 시스템을 이용한다. 이보다는 포함해야 하는 키워드와 제외해야 하는 키워드를 사용자가 순차적으로 검색해나가는 게 더 좋을 것 같다.
권리별 도움말, 사이트 이용안내, 검색 가이드 등 여러 튜토리얼이 있지만 사이트 자체의 서비스와 데이터가 방대한 만큼 문서 내용이 너무 길어서 다 읽기가 힘들었다.
찾아보니 우리 팀이 느꼈던 바를 똑같이 느끼고 있는 사람들이 있었다.
일반적으로 특허검색은 변리사(전문가)에게 맡기는 경우가 많은데, 그래서인지 키프리스 사이트는 직접 선행기술조사를 하려는 일반인이나 우리 같은 비전문가가 사용하기에 진입 장벽이 높다고 생각했다.
그렇다면 우리는 키프리스를 사용하면서 좋았던 점은 따르고, 불편했던 점을 개선하는 방향으로 우리만의 특허 검색 서비스를 만들어보자!
검색 시스템
을 활용하여 대용량 트래픽 처리
경험하기추가 기능
데이터 생성 및 수집 전략
주차 | 일정 |
---|---|
1 | MVP 기획 및 개발 |
2 | MVP 기획 변경 및 개발 완성 |
3 | 중간 발표 + 대용량 데이터 모으기 + 검색 서비스 개발 |
4 | 대용량 트래픽 처리하기 |
5 | 대용량 트래픽 처리하기 |
6 | 프로젝트 완성 및 최종 발표 |