2011. 5. 4.

MapReduce 알고리즘에 대한 설명.

Map 과정(MapTask)

어떤 대상을 MapEntry라는 최소 단위로 쪼갠다..
(한 페이지을 문서를 대상, 문서내의 단어를 최소단위)


Sort/Reduce 과정
각 맵 앤트리를 정해진 규칙에 의해 정열한다.
ReduceInput은 추출된 각 MapEntry들을 유사 그룹으로 묶는다.
(각 MapEntry의 단어의 첫글자가 같다거나... 등등)

ReduceTask 과정
(정제된) ReduceInput을 이용하여 유저가 원하는 처리를 수행한다.
(a로 시작하는 단어 목록을 출력한다.)

댓글 없음: