클라우드/AWS

[AWS Glue] Glue 서비스 외부에서 파라미터 추가하는 법

쟈누이 2023. 12. 21. 13:46
반응형

 

1. 개요


이번에 HDC 프로젝트를 진행하면서 glue 서비스를 사용했음

glue 를 돌릴 때, glue 외부에서 어떻게 파라미터를 넣는지 몰랐는데 이번에 알게 되었음

 

 

 

 

2. 방법


- 간단함. sys 변수에 환경변수를 통해 파라미터를 넣어주는 코드를 짜고

- Glue 의 getResolvedOptions 함수를 이용하여 sys 변수에 있는 변수를 꺼내주면 됨

 

 

 

 

3. 샘플


1) MWAA 코드

glue_task_AAAA = GlueJobOperator(
        task_id = 'glue_task_samp;le',
        job_name = 'sample-mssql-job',
        script_args = {
            '--query' : "select * from dbo.sample_table a",
            '--table_name' : "sample_table",
        }
    )

-> mwaa 에서 script_args 옵션을 이용 key : value 값으로 변수를 생성함

 

 

2) Glue 코드

table_name = None
if '--query' in sys.argv:
    args = getResolvedOptions(sys.argv, ['query'])
    query = args['query']

if '--table_name' in sys.argv:
    args = getResolvedOptions(sys.argv, ['table_name'])
    table_name = args['table_name']

-> getResolvedOptions 옵션을 이용해서 sys.argv를 통해 들어온 query 변수를 args 변수에 저장

-> args 변수에 저장한 쿼리 정보를  query 변수에 넣은 다음 쿼리문 사용

 

 

 

 

반응형