이번 시리즈는 데이터베이스에 관한 포스팅입니다.
포스팅 순서를 살펴보면 저는 앞서 AWS와 OracleSQL에 관해 포스팅한적이 있습니다.
어찌보면 '이제와서 기본을 본다고? 아는거 또하는건가? 시간낭비아냐?'라는
의구심이 들긴하지만 제대로 한번도 데이터베이스에 관해 이론적으로 알지못해
속빈껍데기라 생각했었습니다.
이번 시리즈를 통해 데이터베이스에 관해 차근차근 공부해보겠습니다~📖
일단 필요성을 알기전 데이터란 뭘까😲
데이터는 '현실세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값'을 의미한다.
비슷한 의미로 정보는 '의사결정에 유용하게 활용할 수 있도록 데이터를 처리한 결과물'이다.
즉 다시말해 데이터라는 사실이나 값을 활용할 수 있도록 처리한 결과물이 정보이다.
그렇다면 데이터베이스란 뭘까?
일단 데이터베이스를 알기전 정보 시스템은 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 필요할 때 유용한 정보를 만들어주는 수단이다.
그럼 데이터베이스는 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할을 담당하는 것이다.
위 사진과 같은 구성으로 이뤄진다.
특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장한 운영 데이터 집합.
위 그림에서
1. 공유 데이터
특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터
2. 통합 데이터
최소의 중복과 통제 가능한 중복만 허용하는 데이터
3. 저장 데이터
컴퓨터가 접근할 수 있는 매체에 저장된 데이터
4. 운영 데이터
조직의 주요 기능을 수행하기 위해 지속적으로 꼭 필요한 데이터
1. 실시간 접근
사용자의 데이터 요구에 실시간으로 응답
2. 계속 변화
데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지
3. 동시 공유
서로 다른 데이터의 동시 사용뿐만 아니라 같은 데이터의 동시 사용도 지원
4. 내용 기반 참조
데이터가 저장된 주소나 위치가 아닌 내용으로 참조 가능
데이터는 형태, 특성에 따라 분류할 수 있다.
통계적 관점에서 데이터 특성에 따라 적합한 분석 방법을 선택하기 위해 데이터 분석 분야에서 주로 활용한다.
1. 범주형 데이터
좁은 의미로는 수치형 데이터
객관적인 측정을 통해 수치나 도형, 기호 등으로 표현한 정형 데이터
정략적 데이터에 비해 정석적 데이터가 저장 및 처리 측면에서 더 큰 비용이 드는 경우가 많음 -> 개인적으로 객관적이지 못하고, 이를 객관화 시켜 데이터를 저장하는 과정이 있기 때문이라 생각함