자격증 분류
NCE 자격증 이론정리 65편- Analytics 분야 -Presto 핵심요약
작성자 정보
- 관리자 작성
- 작성일
컨텐츠 정보
- 1,248 조회
- 0 추천
- 목록
본문
Presto 핵심요약
-분산 SQL 쿼리 엔진을 사용하여 분석할 수 있는 툴
-SQL을 지원하며 데이터 분석가와 개발자가 매우 쉽게 사용할 수 있도록 개발
-PB급의 대규모 데이터를 처리하기 위해서는 Presto를 사용하는 것이 적합
-Pig, Hive와 달리 별도의 Presto 쿼리 실행엔진 구현되어 있음 -> 단계별 DISK에 write하지 않고 메모리서 메모리로 데이터를 전달하는 구조여서 Hive보다 빠름
-ETL없이 바로 스토리지에 접근할 수 있는 장점도 있다.
-다만 HDFS에 대한 지원은 Impala에 비해 부족하다.
-HDFS, Hive, Cassandra, RDBMS, S3 다양한 소스로부터 데이터를 읽어올 수 있다.
-Presto를 넘어 Trino도 많이 활용되고있다.
-인터렉티브한 분석에 사용됨
-Tableau와 같은 BI Tool에 연동하기 적합함
"무단배포금지: 클라우드포털(www.linux.co.kr)의 모든 강좌는 저작권에 의해 보호되는 콘텐츠입니다. 무단으로 복제하여 배포하는 행위는 금지되어 있습니다."
관련자료
-
이전
-
다음
댓글 0
등록된 댓글이 없습니다.