반응형
프레스토(Presto)는 페이스북이 개발한 빅 데이터 분석도구로,
분산된 SQL 쿼리 엔진이다.
기존 분석도구인 하이브/맵리듀스에 비해 CPU 효율성과 대기 시간이 10배 빠르다고 알려져 있으며,
'최소 비용으로 효율적인 컴퓨팅 인프라를 구축'하자는 오픈컴퓨트 프로젝트의 일부이다.
그리고, TB, PB 단위의 데이터를 분산쿼리(distributed queries)를 사용하여 분석할 수 있는 툴이며,
HDFS뿐만 아니라 Hive Warehouse, RDBMS 등 다양한 소스로부터 데이터를 읽어올 수 있다고 한다.
맵 리듀스 잡으로 돌아가는 하이브, 피그와 달리, 프레스토는 별도의 쿼리 실행 엔진이
구현되어 있어 단계별 결과를 쓰지 않고 메모리-> 메모리로 데이터를 전달하는 구조이기 때문에
하이브보다 빠르고 좀 더 인터렉티브하게 분석할 수 있다
따라서 tableau 같은 BI 툴에는 파이브보다 프레스토가 연동하기 적합하다
쿼리엔진을 기반으로 하는 빅데이터 분석도구인 것 같다.
https://docs.ncloud.com/ko/hadoop/chadoop-4-7.html
반응형
'Data Engineering > HDFS' 카테고리의 다른 글
[Kafka] 카프카(Kafka) 에 대한 간단 스터디 (0) | 2021.06.11 |
---|---|
[Flume] 아파치 플럼( Flume ) 스터디 (0) | 2021.06.11 |
Apache Sentry : 하둡용 허가(Authorization) 모듈 (0) | 2020.04.20 |
하둡 완벽 가이드 스터디 : 챕터 1. 하둡이란? (0) | 2020.04.18 |
하둡 1. 하둡에 대하여 (0) | 2020.04.11 |