하둡 (Hadoop) 대규모 데이터 분산 저장 및 처리를 돕는 오픈 소스 프레임워크 빅데이터를 처리할 수 있도록 도와주는 프레임워크 구성요소 : Hadoop Distributed File System 구성요소 1) Hadpoop Distributed File Syst
하둡 에코시스템 (Hadoop ecosystem) Apache Hadoop 을 구성하는 도구들을 의미. 프레임워크 또는 플랫폼. 분산 데이터 저장 관리, 처리가 주 기능. 그외의 워크플로우, 데이터 분석, 수집, 직렬화 등의 기능 제공 오픈 소스 대표적으로 HDFS,
Hadoop 분산 파일 시스템Hadoop Distributed File System(HDFS)은 Apache의 가장 크고 핵심적인 구성요소 정형데이터, 비정형 데이터, 반정형 데이터 등 다양한 유령의 대규모 데이터를 저장할 수 있음 리소스에 대한 추상화 수준 생성. H