상세 컨텐츠

본문 제목

[빅데이터] 10. Pentaho로 file데이터를 HIVE로 적재해 보자

IT_리뷰_일상

by Beomi 2023. 7. 17. 11:25

본문

728x90

[빅데이터] 10. Pentaho로 file데이터를 HIVE로 적재해 보자

 

Pentaho 를 사용해 file데이터를 HIVE로 적재 해보자

참고 영상은 하단 유투브 참고!

 

HIVE란?

Hadoop의 EcoSystem중 하나로, HDFS에 저장된 데이터를 RDBMS 형태로 제공하며,HiveQL(SQL과 형태가 유사함) 등으로 쿼리가 가능하다.

hivemetastore를 활용하여 S3 or S3Compatible Storage의 데이터도 쿼리가 가능하다.

기본적으로 실시간성 처리가 아닌,

HDFS or S3 or S3 Compatible Storage에 데이터를 저장하고, 데이터에 맞는 스키마를 metastore에 정의하여 질의 하는 방식

 

응용하여 구조화된 데이터를 hive에 저장하여 분석에 활용할 수 있다.

응용하여 hadoop Ecosystem hive를 활용하는 work-flow를 pentaho로 구현할 수 있다.

 

Pentaho에서 사용된 kettle (transformation)파일은 별도 첨부 하도록 한다.

 

필요 SW : Pentaho Data Integration Client Tool (Spoon Client)

Target DB : hive (hadoop eco system)

 

https://youtu.be/ediGeuewRBY

No8_filedata_hive_input.ktr
0.02MB

728x90

관련글 더보기