Data Engineering/HDFS

Presto 에 대하여?

쟈누이 2020. 6. 30. 10:41
반응형

프레스토(Presto)는 페이스북이 개발한 빅 데이터 분석도구로,

분산된 SQL 쿼리 엔진이다.

 

기존 분석도구인 하이브/맵리듀스에 비해 CPU 효율성과 대기 시간이 10배 빠르다고 알려져 있으며,

'최소 비용으로 효율적인 컴퓨팅 인프라를 구축'하자는 오픈컴퓨트 프로젝트의 일부이다.

 

그리고, TB, PB 단위의 데이터를 분산쿼리(distributed queries)를 사용하여 분석할 수 있는 툴이며,

HDFS뿐만 아니라 Hive Warehouse, RDBMS 등 다양한 소스로부터 데이터를 읽어올 수 있다고 한다.

 

맵 리듀스 잡으로 돌아가는 하이브, 피그와 달리, 프레스토는 별도의 쿼리 실행 엔진이 

구현되어 있어 단계별 결과를 쓰지 않고 메모리-> 메모리로 데이터를 전달하는 구조이기 때문에

하이브보다 빠르고 좀 더 인터렉티브하게 분석할 수 있다

따라서 tableau 같은 BI 툴에는 파이브보다 프레스토가 연동하기 적합하다

 

쿼리엔진을 기반으로 하는 빅데이터 분석도구인 것 같다.

 

https://ko.wikipedia.org/wiki/%ED%94%84%EB%A0%88%EC%8A%A4%ED%86%A0_(SQL_%EC%A7%88%EC%9D%98_%EC%97%94%EC%A7%84)

 

프레스토 (SQL 질의 엔진) - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 프레스토(Presto)는 페이스북이 개발한 빅 데이터 분석도구로, 분산된 SQL 쿼리 엔진이다. 기존 분석도구인 하이브/맵리듀스에 비해 CPU 효율성과 대기 시간이 10배

ko.wikipedia.org

https://docs.ncloud.com/ko/hadoop/chadoop-4-7.html

 

설명서

Cloud Hadoop에서 Presto 사용하기 목차 Presto Overview Presto 클러스터 사용하기 이 페이지에서는 Presto 서비스에 대해 소개하고 Cloud Hadoop에서 Presto를 사용하는 방법을 설명합니다. Presto Overview 이 섹션에

docs.ncloud.com

 

반응형