[part 2] apache spark 와 데이터 병렬 분산 처리 1. 스파크란 스파크는 빅데이터 처리를 위한 고속 분산 처리 엔진 대부분의 회사가 쓰고 있음 빅데이터 문제란? - 데이터의 크기가 증가 - 데이터가 생성되는 속도의 증가 - 데이터의 증가 2. 스파크의 특징 Book/실시간 빅데이터 처리를 위한 Spark & Flink 올인원 패키지 2023.01.31