하둡 개요 오픈소스 SW HDFS + MapReduce 빅데이터 처리 프레임워크 다양한 하둡 에코 시스템으로 구성 결함 허용, 결함이 나도 작업이 중지되지 않고 계속 작업할 수 있는 환경 데이터 블록의 복사본을 중복 저장하고 유지 하둡의 데이터 처리 방식 데이터 블록 전송 단계 하나의 파일을 여러 블록으로 나누어 클러스터에 있는 데이터 노드들에게 분산 저장 데이터 블록 복제 단계 하나의 블록은 여러개의 복제본을 생성하여 분산 저장 원본 데이터를 4개의 블록으로 분할, 분할된 데이터를 복제하여 서로 다른 위치에 있는 각각의 데이터 노드에 분산 저장함 프로그램 코드 전송 단계 전송받은 데이터를 어떤 방식으로 처리할 것인지에 대한 로직이 담긴 프로그램이 있고, 이 코드를 전송하게 됨 데이터 병렬 처리 단계 맵..