"하둡 완벽 가이드"를 기반으로 공부하는 글입니다. 하둡 완벽 가이드 - YES24 ★ 곁에 두고 찾아보는 하둡 최고의 바이블 개정 4판 전격 출간! 하둡 프로젝트의 커미터이자 핵심 설계자인 톰 화이트가 집필한 이 책은 하둡 창시자인 더그 커팅을 비롯한 프로젝트별 전문가 www.yes24.com 분산, 병렬 처리의 개요 쓰기와 읽기의 처리시간을 줄이는 확실한 방법은 여러개의 디스크에서 동시에 데이터를 읽고 쓰는 것이다. = 병렬 처리 문제점 하드웨어 장애 많은 하드웨어를 쓸 수록 장애 포인트는 늘어난다. 데이터 손실 방지를 위해 데이터를 여러곳에 복재해야 한다. = RAID 분할 데이터의 결합 데이터의 정합성을 지키면서, 많은 분할 데이터를 합치는 것은 쉬운일이 아니다. 하둡의 맵리듀스는 Key-valu..