Book/실시간 빅데이터 처리를 위한 Spark & Flink 올인원 패키지

[part 2] apache spark 와 데이터 병렬 분산 처리

쟈누이 2023. 1. 31. 20:16
반응형

1. 스파크란


  • 스파크는 빅데이터 처리를 위한 고속 분산 처리 엔진
  • 대부분의 회사가 쓰고 있음
빅데이터 문제란?
- 데이터의 크기가 증가
- 데이터가 생성되는 속도의 증가
- 데이터의 증가

 

 

 

 

2. 스파크의 특징


반응형