개발 공부는 어려워
반응형

ETL(Extract Transform Load)

 일을 하다보면 한번을 들어보거나 데이터에 관심이 많은 사람이라면 한번을 들어볼 수 있는 단어다. 말 그대로

추출(Extract), 변환(Transform), 적재(Load)이며 내가 원하는 데이터를 추출하여 내 입맛에 맛게 변환한 후 DW(Data Warehouse)에 적재하는 것을 말한다. DW는 중요 개념이기 때문에 다른 게시물에 다뤄보고 단순히 ETL를 이렇게 설명할 수 있다.

 


 

 

 사실 ETL의 개념은 어려운것이 아니다. 예를 들어보자 우리가 보통 DB에 저장하는 시간은 보통 sysdate같이

년월일 시분초(yyyyMMdd HH:mm:ss)로 저장하게 되거나 varchar로 저장하게되어 데이터를 표현하는데. 그 데이터들이 각각 한 컬럼에서 저장되있다고 생각해 보자

2021 09 26 19 46 02
2021 09 27 20 05 34

이런식으로 저장되어있는 DB가 존재한다. 하지만 우리가 사용해야하는 테이블에는

시분초가 한번에 들어가 있는 컬럼이 필요하다 그렇다면 우리는

시분초
2021 09 26 194602
2021 09 27 200534

이런식으로 테이블을 구성하는데, 이 때 ETl 작업을 통하여 테이블을 구성하는 작업을 바로 ETL 작업이라고 표현한다.

 

 

 

 


 

결론적으로 ETL은 Source(원천데이터)에서 Target(넣어줄 DB)로 변환시켜 사용하는 것을 의미한다.

반응형

'회사 > 업무 이해하기' 카테고리의 다른 글

배치 프로그램(Batch Processing)  (0) 2022.04.24
마이그래이션(Migration)  (0) 2022.03.09
암호화 복호화란?  (0) 2021.11.28
[CS] TO-BE, AS-IS  (0) 2021.10.31
profile

개발 공부는 어려워

@신입개발자하랑이

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!