Hadoop 생태계 이해하기

What is Hadoop Hadoop 플랫폼의 주요 벤더인 Hortonworks는 하둡을 이렇게 정의. > 범용 하드웨어로 구축된 컴퓨터 클러스터의 아주 방대한 데이터 세트틀 분산해 저장하고 처리하는 오픈 소스 소프트웨어 플랫폼 Hadoop 오픈 소스 한대의 PC가 아닌 컴퓨터 클러스터에서 작동하는 소프트웨어 묶음 Hadoop은 어느 데이터 센터에서 작동중인 컴퓨터 클러스터 전체에서 실행되도록 설계됨. 즉 Hadoop은 다수의 PC를 활용해 빅데이터를 다룬다. 분산저장 분산 저장은 Hadoop이 제공하는 주 기능. 한 개의 하드 드라이브에 국한되지 않는다. 빅데이터(1TB)를 처리할 때 클러스터에 컴퓨터를 더하기만 하면 그 컴퓨터는 하드 드라이브가 데이터 저장소의 일부가 됨. Hadoop은 클러스터의 모든 하드 드라이브에 걸쳐 분산돼 있는 모든 데이터를 단일 파일 시스템으로 보여줌.

2022년 12월 16일
·
0개의 댓글
·