[서평] 데이터 품질의 비밀

황준하·2023년 5월 28일
0

서평

데이터는 어떻게 저장되고 관리되어 왔을까? 이 책은 데이터의 저장, 관리 등이 어떻게 이루어져왔으며 이에 대한 문제점과 향후 어떤 방향으로 트랜드가 변하고 있는지 알려준다.

나의 경우에는 데이터 분석 및 관리 측면에 관심이 있지는 않았지만 머신러닝, 딥러닝을 통해 데이터를 다루게 되면서 데이터를 100% 신뢰해도 되는지(데이터의 결측값, 이상치 등)와 데이터의 질을 높이기 위한 방법에 대해 생각하게 되었고 좋은 기회로 이 책을 읽게 되었다.

그런 의미에서는 예상과는 사뭇 다른 내용이여서 당황했지만, 데이터가 어떻게 수집되고 관리되는지 깊게 알아볼 수 있는 귀중한 시간이었다.

처음에 현재의 데이터가 어떻게 저장되고 관리되고 있는지 간단하게 알려주며 어떤 방향으로 흘러가고 있는지 짚어준다. (개인적으로는 데이터마트, 데이터레이크 등과 같은 용어도 생소했고 이런 개념이 왜 등장하게 되었으며 어떤 방식을 추구하는지가 인상깊었다) 그리고 차례로 데이터 시스템, 수집 및 정제, 모니터링 등으로 이어진다. [이상 탐지에서는 머신 러닝을 이용하기도 한다]

아직 학생이기도 하고 데이터베이스나 데이터 관리 및 수집에 조예가 없다보니 이 책을 한 번 보는 것만으로 전체 내용을 이해했다고 보기 어려워서 여러 번 다시 읽어봐야겠다.

책정보

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

0개의 댓글