[ADsP 합격 노트] 1-2. 데이터의 가치와 미래
빅데이터의 이해
- 빅데이터의 이해
- 관점에 따른 정의 : Volume, Variety, Velocity, (Values, Visualization, Veracity, Volatility)
- 빅데이터 정의의 범주 및 효과 : 데이터의 변화 → 기술 변화 → 인재, 조직의 변화
- 출현 배경과 변화
- 출현 배경
- 산업계 : 고객 데이터 축적 → 데이터에 숨어있는 가치를 발굴
- 학계 : 거대 데이터활용, 과학 확산 → 아키텍처 및 통계 도구 발전
- 기술발전 : 관련 기술의 발달
- 빅데이터가 만들어내는 본질적인 변화
- 사전처리 → 사후처리
- 표본조사 → 전수조사
- 질 → 양
- 인과관계 → 상관관계
빅데이터의 가치와 영향
- 빅데이터 가치 산정이 어려운 이유
- 데이터 활용 방식 : 재사용, 재조합, 다목적용 데이터 개발 등 → 특정 데이터를 언제·어디서·누가 활용할지 알 수 없게 됨
- 새로운 가치 창출 : 데이터가 기존에 없던 가치를 창출
- 분석 기술 발전 : 추후 새로운 분석 기법이 등장한다면 거대한 가치를 지닌 데이터가 될 수도
비즈니스 모델
- 빅데이터 활용 기본 테크닉
- 연관규칙 학습
- 유형 분석
- 유전자 알고리즘 : 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 메커니즘을 통해 점진적으로 진화시켜 나가는 방법
- 기계학습, 회귀분석, 감정분석, 소셜네트워크분석
위기 요인과 통제 방안
- 사생활 침해 → 동의에서 책임으로(정보 사용자 책임제로 변환)
- 책임 원칙 훼손 → 결과 기반 책임 원칙 고수
- 잘못된 예측 알고리즘을 통한 판단을 근거로 불이익을 줄 수 없음
- 데이터 오용 → 알고리즘 접근 허용
- 불이익을 당한 사람을 대변할 전문가(알고리즈미스트)가 필요
미래의 빅데이터
- 빅데이터 활용의 3요소
- 데이터 → 모든 것의 데이터화
- 기술 → 진화하는 알고리즘, 인공지능
- 인력 → 데이터 사이언티스트, 알고리즈미스트