[Airflow] Airflow DAG란

DAG란?

Airflow에서 ETL을 부르는 명칭으로 Directed Acyclic Graph 의 줄임말

DAG는 태스크로 구성됨

- 만약 3개의 태스크로 구성된다면 Extract, Transform, Load로 구성

- Task 단위로 순서 지정

 

Task란?

Airflow의 오퍼레이터(Operator)로 만들어짐

Airflow에서 제공하는 다양한 종류의 오퍼레이터를 경우에 맞게 사용하거나 직접 개발 

Redshift writing, Postgres query, S3 Read/Write, Hive query, Spark job, shell script 등

 

🔜 이어지는 다음 글 보기 

- [ETL] Airflow 설치하기 (on AWS EC2 ubuntu 서버)

 

[ETL] Airflow 설치하기 (with AWS EC2 ubuntu 서버)

설치 환경 미리 보기✅ 우분투 24.04 사용 (프리티어 가능한 버전 선택)✅ AWS EC2 t3.small or t3a.small 인스턴스사용 Airflow 2.9.1 설치 과정- Airflow 메타데이터베이스로 로컬 서버에 Postgres 설치 예정- Air

ourjune.tistory.com

- [ETL] Mac에서 도커로 Airflow 설치하기

 

[ETL] Mac에서 도커로 Airflow 설치하기

도커 세팅✅ 맥북 기준 최소 4GB (이상적으로는 8GB) 메모리 Docker 할당* 도커 세팅 및 메모리 설정 변경 관련 아래 문서 참고  [Docker] Mac OS 맥에서 Docker Desktop 설치 & 도커 컨테이너 생성Docker Desktop

ourjune.tistory.com