엔터프라이즈 데이터 플랫폼 구축

엔터프라이즈 데이터 플랫폼 구축

데이터 노드는 HDFS 블록과 블록의 ID만 알고 있다 - 파일이 어느 복제본에 속하는지는 모른다.

네임노드가 메타데이터 가지고 있다 - fsimage에서 확인했던대로.

얀은 직접 데이터를 다루며 연산을 수행하지는 않는다.

하이브는 LLAP(Live Long And Process)를 통해 처리 속도를 높혔다.

HBase는 HDFS에서의 랜덤 엑세스를 순차적 엑세스로 바꿔서 처리 가능.

임팔라, 쿠두, 솔라, 우지같은 처음 보는 기술들도 많았다.

1장, 2장 완료

아직 간단한 소개가 전부여서 딱히 기록할 만한 것이 없다!

from http://kpsy20.tistory.com/9 by ccl(A) rewrite - 2021-12-29 17:27:07