데이터베이스_기본개념

윤일권·2022년 9월 6일
0

DataBase

목록 보기
1/5

시리즈 첫 포스팅을 시작하기 앞서...🙄

이번 시리즈는 데이터베이스에 관한 포스팅입니다.
포스팅 순서를 살펴보면 저는 앞서 AWS와 OracleSQL에 관해 포스팅한적이 있습니다.
어찌보면 '이제와서 기본을 본다고? 아는거 또하는건가? 시간낭비아냐?'라는
의구심이 들긴하지만 제대로 한번도 데이터베이스에 관해 이론적으로 알지못해
속빈껍데기라 생각했었습니다.
이번 시리즈를 통해 데이터베이스에 관해 차근차근 공부해보겠습니다~📖

목차📝

  • 데이터베이스의 필요성
  • 데이터베이스의 정의와 특징
  • 파일시스템과 데이터베이스
  • 데이터 과학 시대의 데이터

데이터베이스의 필요성

  • 일단 필요성을 알기전 데이터란 뭘까😲
    데이터는 '현실세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값'을 의미한다.
    비슷한 의미로 정보는 '의사결정에 유용하게 활용할 수 있도록 데이터를 처리한 결과물'이다.
    즉 다시말해 데이터라는 사실이나 값을 활용할 수 있도록 처리한 결과물이 정보이다.

  • 그렇다면 데이터베이스란 뭘까?
    일단 데이터베이스를 알기전 정보 시스템은 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 필요할 때 유용한 정보를 만들어주는 수단이다.
    그럼 데이터베이스는 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할을 담당하는 것이다.

    위 사진과 같은 구성으로 이뤄진다.

데이터베이스의 정의와 특징

데이터베이스 정의

특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장한 운영 데이터 집합.

위 그림에서
1. 공유 데이터
특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터
2. 통합 데이터
최소의 중복과 통제 가능한 중복만 허용하는 데이터
3. 저장 데이터
컴퓨터가 접근할 수 있는 매체에 저장된 데이터
4. 운영 데이터
조직의 주요 기능을 수행하기 위해 지속적으로 꼭 필요한 데이터

데이터베이스의 특징

업로드중..
1. 실시간 접근
사용자의 데이터 요구에 실시간으로 응답
2. 계속 변화
데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지
3. 동시 공유
서로 다른 데이터의 동시 사용뿐만 아니라 같은 데이터의 동시 사용도 지원
4. 내용 기반 참조
데이터가 저장된 주소나 위치가 아닌 내용으로 참조 가능

데이터

데이터는 형태, 특성에 따라 분류할 수 있다.

형태에 따른 데이터 분류

  1. 정형 데이터
  • 구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터.
  • 데이터 구조에 대한 설명과 데이터 내용은 별도로 유지된다.
  • 예시) 엑셀의 스프레드시트, 관계 데이터베이스의 테이블
  1. 반정형 데이터
  • 구조에 따라 저장된 데이터지만 데이터 내용 안에 구조에 대한 설명이 함께 존재
  • 구조를 파악하는 파싱과정이 필요, 보통 파일 형태로 저장
  • 예시) 웹에서 데이터를 교환하기 위해 작성하는 HTML, XML, JSON문서나 웹로그, 센서데이터 등
  1. 비정형 데이터
  • 정해진 구조가 없이 저장된 데이터
  • 예시) 소셜 데이터의 텍스트, 영상, 이미지, 워드나 PDF 문서와 같은 멀티미디어 데이터

특성에 따른 데이터 분류

통계적 관점에서 데이터 특성에 따라 적합한 분석 방법을 선택하기 위해 데이터 분석 분야에서 주로 활용한다.
1. 범주형 데이터

  • 범주로 구분할 수 있는 값, 즉 종류를 나타내는 값을 가진 데이터
  • 크기 비교와 산술적인 연산이 가능하지 않아 질적 데이터라고 한다.
  • 명목적 데이터 : 순서, 즉 서열이 없는 값을 가지는 데이터(성별, 혈액형 등)
  • 순서형 데이터 : 순서, 즉 서열이 있는 값을 가지는 데이터(학년, 학점 등)
  1. 수치형 데이터
  • 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터
  • 양적 데이터라고도 함.
  • 이산형 데이터 : 개수를 셀 수 있는 띄엄띄엄 단절된 숫자 값을 가지는 데이터(고객 수, 판매량 등)
  • 연속형 데이터 : 측정을 통해 얻어지는 연속적으로 이어진 숫자 값을 가지는 데이터(키, 몸무게 등)

그 외 데이터

  1. 정성적 데이터
  • 좁은 의미로는 범주형 데이터
  • 사람의 주관적인 생각과 평가를 기술한 비정형 데이터
  1. 정략적 데이터
  • 좁은 의미로는 수치형 데이터

  • 객관적인 측정을 통해 수치나 도형, 기호 등으로 표현한 정형 데이터

  • 정략적 데이터에 비해 정석적 데이터가 저장 및 처리 측면에서 더 큰 비용이 드는 경우가 많음 -> 개인적으로 객관적이지 못하고, 이를 객관화 시켜 데이터를 저장하는 과정이 있기 때문이라 생각함

profile
생각하는 개발자가 되겠습니다!!

0개의 댓글