1) 데이터의 의미와 특성
2) 데이터의 유형
3) 지식경영과 지식창조 프로세스
지식창조 이론 : 기업 내에서 지식이 창출되는 과정 및 창조적 지식개발능력을 제고하는 조직형태와 적용방향을 설명
지식창조 매커니즘은 1회에 끝나는것이 아니라 나선형 형태로 지속되고 반복되는 과정에서 지식이 축적되는 것이다.
암묵지 : 언어 등의 형식을 갖추어 표현 될수 없는 경험과 학습의 몸에 쌓인 지식
형식지 : 구체적이거나 문서화된 것으로 공식적이고 체계적인 언어도 전달 가능한 지식
특성 | 내용 |
---|---|
공동화(Socialization) | - 암묵지를 고차원의 암묵지로 전환하는 과정 - 조직원간에 초보적인 경험과 인식을 공유하여 한 차원 높은 암묵지를 창조 |
표준화(Externalization) | - 암묵지를 형식지로 전환하는 과정 - 암묵지가 구체적인 개념으로 전환되고 언어로 표현되어 공식화 |
연결화(Combination) | - 분산된 형식지의 단편들을 수집, 분류, 통합하여 새로운 형식지를 창조하는 과정 - 지식을 체계화하여 지식체계로 전환 |
내면화(Internalization) | - 형식지를 다시 암묵지로 전환 - 공동화, 표준화, 연결화를 통해서 검증받은 모델이나 기술적 노하우가 개인의 암묵지로 체화 |
구분 | 특징 |
---|---|
지혜(Wisdom) | - 근본적인 원리를 이해하고 이를 토대로 도축되는 창의적인 아이디어 |
지식(Knowledge) | - 상호 연결된 정보패턴을 이해하고 이를 토대로 해서 예측한 결과물 |
정보(Information) | - 데이터의 가공 및 상관관계 간 이해를 통해서 패턴을 인식하고 의미를 부여한 데이터 |
데이터(Data) | 존재형식을 불문하고 타 데이터와의 상관관계가 없는 가공 전의 순수한 수치나 기호를 의미 |
구성 | 설명 |
---|---|
통합된 데이터 | - 데이터의 중복없이 저장하여 데이터를 최소화 |
저장된 데이터 | - 컴퓨터가 접근 가능한 저장매체에 저장된 데이터 |
운영 데이터 | - 기업의 목적에 맞에 운영할 수 있는 데이터 |
공용 데이터 | - 기업이나 조직이 공동으로 소유하고 활용 |
특징 | 설명 |
---|---|
실시간성(Real Time) | - 다수의 사용자로부터 데이터 검색, 질의에 즉시 응당 |
지속적 변환(Continuos Evaluation) | - 데이터 입력, 수정, 삭제 등의 작업으로 최신의 데이터를 유지함 |
동시 공유성(Concurrent Sharing) | - 여러 사용자가 데이터에 접근하고 공유함 |
내용에 의한 참조(Content Reference) | - 데이터의 참조는 데이터 내용에 의해서 참조됨 |
특징 | 설명 |
---|---|
주체지향적(Subject Oriented) | - 정보를 주제에 맞게 (고객, 창구, 상품 등) 분류, 가공하여 구조화 |
통합적(Intergrated) | - 기업 내부의 운영 데이터와 기업 외부에서 수집된 외부 데이터는 통합하고 가공 |
시계열성(Time-variant) | - 과거, 현재 데이터를 일정기간 동안 저장하여 미래를 예측하고 시점 별로 분석이 가능 |
비소멸성(Non-volatile) | - 갱신이 발생하지 않는 조회 전용 |
구성요소 | 주요 내용 |
---|---|
데이터 모델(Data Model) | - 주체지향적으로 설계된 ER(Entity Relationship) 모델 - OLAP을 활용한 다차원 분석을 위한 다차원 모델 |
ETL(Extract Transform Load) | - 기업내부 및 기업외부 데이터를 추출, 정제, 및 데이터 웨어하우스에 적재를 수행하는 작업 |
ODS(Operational Data Store) | 다수의 OTLP 시스템에서 추출한 데이터를 통합적으로 관리하는 데이터베이스 |
DW Meta Data | - DW의 데이터 모델에 대한 정의를 제공하는 운영 메타데이터와 비즈니스 측면에서 정보를 제공하는 활용 메타 데이터 |
OLAP(Online Analytical Processing) | - 고객이 직접 OLAP 툴을 통하여 다차원 분석을 수행하는 솔루션 |
데이터마이닝(Data Mining) | - 대규모의 데이터로부터 이미 알려지지 않은 사실과 패턴을 분석하는 과정 |
경영기반 솔루션 | - 분석을 위한 BSC, RMS, BI, DSS, EIS 등의 경영기반 솔루션 |
구분 | 설명 |
---|---|
KMS(Knoweledge Management System) | - 조직 내의 인적자원들이 축적한 지식을 체계화하고 공유하는 기업정보 시스템 |
ERP(Enterprise Resource Planning) | - 기업 업무 프로세스를 통합적으로 연계관리 해주며, 실시간 빠른 처리 제공 |
SCM(Supply Chain Management) | - 공급사슬 상의 정보, 물자, 현금흐름에 대해 총체적인 관점에서 체인 간의 인터페이스 및 프로세스를 통합관리 |
CRM(Customer Relationship Management) | - 고객과의 관계를 강화하기 위한 전략으로 LTV(Life Time Value)를 극대화가히 위한 경영전략 |
EAI(Enterprise Application Intergration) | - 전사적 애플리케이션을 연동하여 필요한 정보를 중앙집중적으로 통합, 관리, 사용할 수 있는 미들웨어 솔루션 |
클라우드 컴퓨팅(Cluod Computing) | |
ISP(Information Strategy Planning) | - 비즈니스 중장기 경영비전 및 전략을 효과적으로 지원하기 위해서 전사적인 관점에서 정보시스템, 정보관리 체계, 정보시스템 절략계획을 수립하는 활동 - 조직의 경영목표 및 비즈니스 전략을 효과적으로 지원하기 위해서 정보화 전략을 수립하는 컨설팅 |
특성 | 내용 |
---|---|
01.Volume (규모) | |
02.Vairety(다양성) | |
03.Velocity(속도) | |
04.Veracity(정확성) | |
05.Value(가치) |
테크닉 | 내용 |
---|---|
01.연관규칙 학습 | - 어떤 변수들간의 관련성을 분석 |
02.유형분석 | - 문서를 분류하거나 조직을 그룹화 |
03.기계학습 | - 데이터를 학습하여 알려진 특성을 활용하여 예측 |
04.유전 알고리즘 | - 대량의 유전자 데이터분석을 통해서 특정 알고리즘을 도출하고 활용 |
05.회귀분석 | - 독립변수와 종목변수 간의 어떤 관계가 있는지 분석 |
06.감성분석 | - 특정 주제에 대해서 말을 하거나 글을 쓴 사람의 감정을 분석 |
07.소셜 네트워크 분석 | 특정인과 다른 사람의 관계를 파악하고 영향력있는 사람을 분석 |
흐름 | 영역 | 관련기술 |
---|---|---|
소스 | - 내부 데이터 - 외부데이터 | - DB, FMS - File, Multimetia, Streaming |
수집 | - 크로링 - ETL | - 웹로봇을 사용한 웹페이지 수집 - 소스 데이터 추출, 전송, 변환, 적재 |
저장 | - NoSQL, DB - Storage - Servers | - 비정형 데이터 처리 - 빅데이터 저장 - 초경량 서버 |
처리 | - Map Reduce - Processing | - 데이터 추출 - 다중 업무처리 |
분석 | - NPL - Machine Learning - Serialization | - 자연어 처리 - 데이터 패턴 발견 - 데이터 순서화 |
표현 | - Visualization - Acquisition | - 도표, 그래픽으로 가시화 - 데이터 획득 및 재해석 |
1) 데이터 레이크 (Data Lakes)
2) 데이터 레이크 보호방식
3) 빅데이터 저장방식
1) 개인정보보호 가이드라인
2) 비식별화와 익명 데이터
구분 | 특징 |
---|---|
하드스킬 | - 빅데이터 처리 및 분석에 필요한 이론적 지식, 기술적 숙련과 관련된 능력 - 머신러닝, 통계, 분산 컴퓨팅 |
소프트스킬 | - 데이터의 가치를 발견하고 기회를 만들 수 있는 능력 - 창의적 사고, 호기심, 논리적 비판, 스토리텔링, 비주얼라이제이션, 커뮤니케이션 |
유형 | 설명 |
---|---|
최적화(Optimization) | - 분석대상 및 분석방법을 알고 있는 경우에 문제를 해결하기 위해서 최적화 수행 |
솔루션(Solution) | 분석대상을 알고 있지만 분석방법을 알지 못하는 경우 솔루션을 찾는 방법으로 분석과제를 수행 |
통찰(Insight) | 분석대상이 불분명하지만 분석방법을 알고 있는 경우에 통찰을 도출 |
발견(Discovery) | 분석대상과 분석방법을 모를때 분석 자체를 새롭게 도출 |
No. | 고려사항 | 설명 |
---|---|---|
1 | 가용데이터(Available Data) | - 정형/비정형/반정형 데이터 등으로 분석을 위해서 데이터 확보 - 수집되는 데이터의 유형에 따라서 실제 분석을 하는 방법도 달라지고 분석 솔루션도 달라짐 |
2 | 유즈케이스(Proper Use-case)탐색 | - 빅데이터 분석을 위해서 이전 프로젝트에서 사용된 시나리오를 활용하면 최대한 정확하게 분석 |
3 | 장애요소 사전제거(Low Barrier of Execution) | - 기업의 비즈니스 변화에 따라 변하는 환경에서는 지속적이고 반복적인 분석활동을 통해서 변화하는 분석모델을 만드는것이 중요 - 일회성 분석 활동이 아니라 지속적인 분석활동을 하기 위해서 장애요서 제거 |
1) 존재론적 특징
2) 목적론적 특징
3) 수집활동에서의 데이터 특징
1) 필요 데이터 정의
2) 데이터 확보 방안
3) 단계적 데이터 확보 방법
단계 | 내용 | 방법 |
---|---|---|
1단계 Silos Hoarding | - 조직의 독자적 데이터 생성, 저장 중심의 단계 - 외부데이터는 인터넷을 통한 수집 가능 - 데이터의 신뢰성과 품질제고 노력 필요 | 생성, 저장, 수집(검색) |
2단계 Exchanges Sharing | - 기업의 데이터를 외부 기관들과 상호 교환하는 단계 | 연계 및 공유 |
3단계 Pools Aggregation | - 특정한 활동이나 목적을 위해 모인 연합, 그룹, 클럽들이 상호협력과 공동의 장 형성 - 표준화된 데이터 Pool의 연계를 통해 국경을 초월한 정보 교환과 상호이용 가능 | 참여, 협력 |
4단계 Commons Co-creating | - 오픈방식 플랫폼을 통한 데이터 공유 - 상호협력과 참여를 통해 공동의 자원 창조 | 오픈, 창조 |
1) 분석과제 추진가능성 검토
평가항목 | 방법 |
---|---|
필요성 | 공공정책 결정이나 공공 서비스 측면에서 본 분석과제가 필요한지를 판단 |
파급효과 | 정성적, 정량적 기대효과의 정보를 판단 |
추진 시급성 | 당장 해소되어야 할 사회현안 여부를 판단 |
구현 가능성 | 과제를 구현함에 있어서 어려움이 없는지 현실성을 판단 |
데이터 수집 가능성 | 기관 협조나 데이터 확보, 데이터 구매 비용 등 제약사항을 판단 |
모델 확장성 | 과제가 시범 과제로 끝나지 않고 전국 모델로 확장 가능한지를 판단 |
2) 분석방안 수립