데이터과학

이도현·2023년 11월 12일
0

데이터 과학

목록 보기
1/2
post-thumbnail

썸네일의 로고는 "Data Science Central"의 로고이다.
https://www.datasciencecentral.com/
위 링크를 따라가면 데이터과학관련 좋은 글들을 확인해 볼 수 있다.

0. 개요

데이터 과학은 들어나는 데이터 속에서 결과를 또는 예측등을 분석을 통해 도출한다.
무엇인지 알아보자.

1. 데이터 과학이란?

데이터 과학은 비즈니스에 대한 의미 있는 인사이트를 추출하기 위한 데이터 연구로서, 수학, 통계, 인공 지능 및 컴퓨터 공학 분야의 원칙과 사례를 결합하여 대량의 데이터를 분석하는 종합적인 접근 방식

2. 데이터 과학이 중요한 이유

데이터 과학은 도구, 방법 및 기술을 결합하여 데이터에서 의미를 생성하기 때문에 중요합니다. 시간이 쌓일 수록 데이터의 양은 급진적으로 증가하며 이 데이터에서 결과를 도출해 낸 다는 것은 매우 유의미한 일

3. 데이터 과학의 사용

1)기술분석

데이터를 검사하여 데이터 환경에서 무슨 일이 일어났는지 또는 일어나고 있는지에 대한 인사이트를 제공하며, 시각화를 특징으로 함

2) 진단 분석

문제가 발생한 이유를 이해하기 위한 심충 분석 또는 상세한 데이터 검사. 드릴다운, 데이터 검색, 데이터 마이닝, 상관 관계 등의 기술을 특징으로 함

3) 예측 분석

과거 데이터를 사용하여 미래에 발생할 수 있는 데이터 패턴에 대한 정확한 예측울 수행. 기계 학습, 예측, 패턴 일치 및 예측 모델링과 같은 기술을 특징으로 함.

4)처방적 분석

일어날 가능성이 있는 일을 예측할 뿐만 아니라 그 결과에 대한 최적의 응답을 제안. 다양한 선택 사항의 잠재적 영향을 분석하고 최상의 조치를 제안

4. 비지니스를 위한 데이터 과학의 이점

1) 알려지지 않은 변형 패턴 발견

기업은 조직을 변화시킬 가능성이 있는 새로운 패턴과 관계를 발견할수 있다.
예를 들어 순이익률에 최대한 증가시키기 위해 자원 관리에 대한 효율적인 변경사항을 발견할 수 있습니다.

2) 새로운 제품 및 솔루션 혁신

눈에 띄지 않는 격차와 문제를 발견함으로서, 구매 결정, 고객 피드백, 비지니스 프로세스에 대한 더 나은 인사이트는 내부 운영 및 외부 솔루션의 혁신을 주도할 수 있다.

3) 실시간 최적화

기업의 변화를 예측하고 다양한 상황에 최적으로 대응하는데 도움이 될 수 있습니다. 예를 들어 트럭 운송 회사는 데이터 과학을 사용하여 트럭이 고장 났을 때 트럭을 수리하고 운송 스케줄을 최적화하는데 데이터 과학이 사용 될 수 있습니다.

5. 데이터 과학 프로세스(OSEMN)

1) 데이터 획득(Obtain data)

  • 기존 데이터, 새로 획득한 데이터 또는 인터넷에서 다운로드할 수 있는 데이터 리포지토리일 수 있다.

2) 데이터 스크럽(Scrub data)

  • 데이터 스크럼 또는 데이터 정리는 미리 결정된 형식에 따라 데이터를 표준화하는 프로세스
  • 누락된 데이터 처리, 데이터 오류 수정, 데이터 이상값 제거가 포함

3) 데이터 탐색(Explore data)

  • 추가 데이터 모델링 전략을 계획하는데 사용되는 예비 데이터 분석
  • 데이터 사이언티스트는 기술 통계 및 데이터 시각화 도구를 사용하여 데이터에 대한 초기 이해를 얻음. 그 다음 데이터를 탐색하여 연구하거나 작업할 수 있는 흥미로운 패턴을 식별

4) 데이터 모델링

  • 소프트웨어 및 기계학습 알고리즘은 더 깊은 인사이트를 얻고 결과를 예측하고 최상의 조치를 제안하는데 사용.
  • 연관, 분류 및 클러스터링과 같은 기계학습 기술이 훈련 데이터 집합에 적용 됨

5) 결과 해석

  • 데이터 사이언티스트는 분석가 및 기업과 협력하여 데이터 인사이트를 해결방법으로 이어지게 함
  • 추세와 예측을 나타내는 다이어그램, 그래프 및 차트를 만듬
  • 데이터 요약은 이해 관계자가 결과를 효과적으로 이해하고 이행하는데 도움

Reference

profile
좋은 지식 나누어요

0개의 댓글