반응형
ETL(Extract Transform Load)
일을 하다보면 한번을 들어보거나 데이터에 관심이 많은 사람이라면 한번을 들어볼 수 있는 단어다. 말 그대로
추출(Extract), 변환(Transform), 적재(Load)이며 내가 원하는 데이터를 추출하여 내 입맛에 맛게 변환한 후 DW(Data Warehouse)에 적재하는 것을 말한다. DW는 중요 개념이기 때문에 다른 게시물에 다뤄보고 단순히 ETL를 이렇게 설명할 수 있다.
사실 ETL의 개념은 어려운것이 아니다. 예를 들어보자 우리가 보통 DB에 저장하는 시간은 보통 sysdate같이
년월일 시분초(yyyyMMdd HH:mm:ss)로 저장하게 되거나 varchar로 저장하게되어 데이터를 표현하는데. 그 데이터들이 각각 한 컬럼에서 저장되있다고 생각해 보자
년 | 월 | 일 | 시 | 분 | 초 |
2021 | 09 | 26 | 19 | 46 | 02 |
2021 | 09 | 27 | 20 | 05 | 34 |
이런식으로 저장되어있는 DB가 존재한다. 하지만 우리가 사용해야하는 테이블에는
시분초가 한번에 들어가 있는 컬럼이 필요하다 그렇다면 우리는
년 | 월 | 일 | 시분초 |
2021 | 09 | 26 | 194602 |
2021 | 09 | 27 | 200534 |
이런식으로 테이블을 구성하는데, 이 때 ETl 작업을 통하여 테이블을 구성하는 작업을 바로 ETL 작업이라고 표현한다.
결론적으로 ETL은 Source(원천데이터)에서 Target(넣어줄 DB)로 변환시켜 사용하는 것을 의미한다.
반응형
'회사 > 업무 이해하기' 카테고리의 다른 글
배치 프로그램(Batch Processing) (0) | 2022.04.24 |
---|---|
마이그래이션(Migration) (0) | 2022.03.09 |
암호화 복호화란? (0) | 2021.11.28 |
[CS] TO-BE, AS-IS (0) | 2021.10.31 |