정의
Apache Hadoop 으로
분산 파일시스템과 빅데이터를 처리하기 위한 분산 처리 시스템을 제공하는
아파치 소프트에어 재단의 오픈 소스 프레임워크이다.
JAVA로 개발되었으며 원래 목적은 검색엔진을 만들기 위해서 만들어 졌다.
마스코트는 코끼리로 아들이 놀던 장난감을 보고 지었다고 한다.
구성?
-Hadoop HBase: NoSQL 데이터베이스로 만들어짐
-HDFS:Hadoop Distributed File System, 분산파일 시스템
-Hadoop Map Reduce: 분산처리 시스템
구글의 논문을 보고 오픈소스로 구현한 것
'Data > Processing' 카테고리의 다른 글
빅데이터 프로세싱이란 . (0) | 2019.04.03 |
---|