자격증 분류
NCE 자격증 이론정리 66편- Analytics 분야 -Impala 핵심요약
작성자 정보
- 관리자 작성
- 작성일
컨텐츠 정보
- 1,304 조회
- 0 추천
- 목록
본문
Impala 핵심요약
-Hive의 실시간성 query 성능 문제를 해결하기위해 Cloudera에서 개발하여 opensource화함
-대규모 병렬 처리 엔진
-Datawarehouse 분야 뿐만 아니라 실시간 데이터 분석을 위한 구성에도 사용 가능
-Hadoop or Cloud Storage에 저장된 대용량 데이터셋에 대한 고속 대화형 SQL 쿼리를 통해 데이터 분석업무에서 원하는 데이터를 빠르고 쉽게 얻을 수 있다.
-보통 Data Mart에서 많이 활용
-속도와 효율에 초점을 맞추므로 자체 분산 Query Engine을 사용한다.
-Impala에서는 데이터가 분산 연산자 트리를 스트림으로 통과하면서 처리된다.
-Text File, HBase 테이블 , Avro 등 다양한 데이터 소스를 지원한다.
"무단배포금지: 클라우드포털(www.linux.co.kr)의 모든 강좌는 저작권에 의해 보호되는 콘텐츠입니다. 무단으로 복제하여 배포하는 행위는 금지되어 있습니다."
관련자료
-
이전
-
다음
댓글 0
등록된 댓글이 없습니다.