Chapter 1. 데이터베이스 기본 개념

Suji Park·2022년 7월 19일
0
post-thumbnail

01. 데이터베이스의 필요성

1. 데이터와 정보

  • 데이터data란, 관찰하거나 측정하여 수집된 사실fact 혹은 값value
  • 정보information란, 의사 결정에 활용할 수 있도록 데이터를 처리 및 가공한 결과물
  • 정보처리information processing란,
    • 데이터에서 정보를 추출하는 과정 또는 방법
    • 데이터를 상황에 맞게 분석하거나 해석하여 데이터 간의 의미 관계를 파악하는 것

2. 정보 시스템과 데이터 베이스

  • 정보시스템information System란, 조직운영에 필요한 데이터를 수집하여 저장해두었다가 의사결정이 필요할 때 처리하여 유용한 정보를 만들어주는 수단
  • 정보시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 핵심 역할을 데이터베이스가 담당

02. 데이터베이스의 정의와 특징

1. 데이터베이스의 정의

  • 데이터 베이스DataBase란, 특정 조직의 여러 사용자가 '공유'하여 사용할 수 있도록 '통합'해서 '저장'한 '운영'데이터의 집합
    • 공유 데이터shared data : 여러 사용자가 함께 이용해야 함, 사용 목적이 다른 사용자들을 모두 고려
    • 통합 데이터integrated data : 데이터의 중복data redundancy을 최소화하고 통제가 가능한 중복만 허용하는 데이터
    • 저장 데이터stored data : 컴퓨터가 접근할 수 있는 매체에 저장
    • 운영 데이터operational data : 지속적으로 유지해야 함

2. 데이터베이스의 특징

  • 실시간 접근성real-time accessibility : 사용자의 데이터 요구에 실시간으로 응답
  • 계속 변화continuous evolution : 동적으로 삽입insert/삭제delete/수정update을 통해 현재의 데이터를 유지
  • 동시 공유concurrent sharing : 여러 사용자가 같은 데이터를 동시에 사용 가능
  • 내용 기반 참조content reference : 저장된 주소나 위치가 아닌 내용content, 즉 값value으로 참조 가능

03. 데이터 과학 시대의 데이터

데이터 유형별 저장 및 처리기술을 적합하게 선택해야 한다.

1. 형태에 따른 데이터 분류

  • 정형 데이터structured data : 정해진 구조에 따라 저장된 데이터 (엑셀, 관계데이터베이스RDBMS의 테이블)
    - 스키마schema : 미리 정해진 데이터 구조

  • 반정형 데이터semi-structured data : 구조에 따라 저장됐지만, 데이터 내용 안에 구조에 대한 설명이 함께 존재 (HTML, XML, JSON 등)
    - 내용과 함께 설명된 데이터 구조를 스키마라고도 하지만 메타 데이터metadata라고도 한다.

  • 비정형 데이터unstructured data : 정해진 구조가 없이 저장된 데이터 (소셜 데이터의 텍스트/영상/이미지 등)

2. 특성에 따른 데이터 분류

  • 범주형 데이터catagorical data: 범주category로 구분할 수 있는 값, 즉 종류를 나타내는 값을 가진 데이터
    • 명목형 데이터nomininal data:순서, 즉 서열이 없는 값을 가진 데이터 (MBTI, 혈액형, 학과명 등)
    • 순서형 데이터ordinal data : 순서, 즉 서열이 있는 값을 가진 데이터 (학년, 학점, 회원등급 등)
  • 수치형 데이터numerical data: 양적데이터Quantitative Data, 양적 측면에서 크기 비교와 연산이 가능한 숫자 값을 가진 데이터
    • 이산형 데이터discrete data : 이어지지 않고 띄엄띄엄 단절된 숫자 값을 가진 데이터 ( 고객 수, 판매량, 합격자 수 등)
    • 연속형 데이터continuous data : 연속적으로 이어진 숫자 값을 가지는 데이터 (키, 몸무게, 온도 등)
profile
천방지축😛 얼레벌레🙄 빙글빙글🙃 돌아가는 수지의 코드~🎵

0개의 댓글