클라우드/AWS

[AWS Glue] Glue connection 에 대하여

쟈누이 2023. 12. 22. 13:52
반응형

 

1. Glue Connection 이란


- AWS Glue에서 데이터 스토어나 데이터베이스와의 연결을 설정하는 데 사용되는 서비스

- 예를 들어, AWS Glue는 데이터를 추출, 변환, 로드(ETL)하기 위해 다양한 소스에서 데이터를 가져올 수 있음

- 즉, Glue Connection은 이런 데이터 소스와 Glue의 ETL 작업 간의 다리 역할을 하는 서비스

 

 

 

2. Glue Connection 을 사용할 경우 Glue Job 은 어디서 도는 것인가


 

- Glue Job 은 VPC 외부에서 돌며, Glue connection 을 이용해 vpc-subnet 을 타고 들어가 외부와 통신을 함

- 왜냐하면, Glue 는 퍼블릭 서비스이기 때문에 VPC 외부에 생성이 됨

- 하지만, Glue Connection 을 사용할 경우, Glue connection 을 통해서만 외부와 통신을 하기 떄문에 Glue Job 이 서브넷 안에 생성되어 돌아가는 것으로도 보일 수 있음

- Glue Connection 을 사용하지 않을 경우에는 자유롭게 외부와의 통신이 가능함

- 보통 Glue Connection 을 사용하는 경우에는 On-premise 와 통신할 때 사용(왜냐하면 보안을 위해 vpc 를 통해 통신하도록 보통 설계를 하니깐)

- 즉, 글루 잡은 VPC 외부에 생성이 되지만 Glue Connection 을 사용하면 폐쇠망에서 사용하는 것 과 같은 효과를 낼 수 있다.

 

 

 

3. 추가 지식


- Glue Connection 을 사용할 경우 서브넷과 Glue 사이에 ENI(Elastic Network Interface - 전용 인터넷 회선이라고 보면됨) 이 생긴다

- ENI 의 생성조건은 
        1. VPC 생성되어 있어야 함

        2. Subnet 생성되어 있어야 함

        3. 보안그룹이 생성되어 있어야 함

반응형