Chapter1 데이터 사이언스 시작

매일 공부(ML)·2022년 1월 28일
0

학습 목표

  • 데이터 사이언스에 대한 기본 개념을 이해합니다.

핵심 키워드

  • 데이터 사이언스 정의

  • 데이터 사이언스와 통계학

  • 데이터 사이언스 벤 다이어그램

  • 데이터와 인공지능의 관계

  • 머신러닝과 딥러닝


데이터 사이언스

  • 콘웨이의 데이터 사이언스 벤다이어그램

  • 아래의 모든 것을 아우르는 것을 데이터 사이언스라고 정의합니다.

    • Hacking Skills

    • Math & Statistics Knowledge

    • ML

    • Danger Zone

    • Traditional Research

    • Substantive Experts


데이터 사이언스

*통계학

다량의 데이터를 관찰하고 정리 및 분석하는 방법 연구


*데이터 사이언스

데이터 마이닝과 유사한 (비)정형 형태를 포함한 다양한 데이터로부터 인사이트를 추출하는 방식입니다.

즉, 데이터를 통해 실제 현상을 이해하고 분석하는 것을 말합니다.

이때, 통계학~ 기계학습까지 다양한 방식을 이용해서 수행합니다.


*데이터 분석

유용한 정보 발굴 및 결론 내용 도출을 통해서 의사결정을 지원하는 것을 목표로 합니다.

이것 또한, 다각적 활용도가 가능하기에 비즈니스 부문에서 더 효율적으로 증강시켜줍니다.


*탐색적 데이터 분석(EDA)

미국의 통계학자가 만든 자료 분석 방법론으로 기존에는 오로지 정보의 추출적 느낌만 있어서 본연의 의미를 찾기는 어려웠습니다.

그래서, 주어진 자료만 가져도 충분하게 정보를 탐색하는 방법을 연구한 끝에 나온 것이 EDA입니다.


*정보 디자인

정보를 구성하여 효율적으로 사용할 수 있게 디자인 기술 및 업무를 말하는 것으로 복잡하거나 구조화되지 않은 데이터를 시각화하여 좀 더 명료하게 보이는 것에 초점을 둡니다.


*데이터의 중요성

garbage in garbage out

어떤 데이터를 어떻게 넣어주느냐에 따라서 결과가 달라진다.

profile
성장을 도울 아카이빙 블로그

0개의 댓글