[빅데이터] 10. Pentaho로 file데이터를 HIVE로 적재해 보자
[빅데이터] 10. Pentaho로 file데이터를 HIVE로 적재해 보자 Pentaho 를 사용해 file데이터를 HIVE로 적재 해보자 참고 영상은 하단 유투브 참고! HIVE란? Hadoop의 EcoSystem중 하나로, HDFS에 저장된 데이터를 RDBMS 형태로 제공하며,HiveQL(SQL과 형태가 유사함) 등으로 쿼리가 가능하다. hivemetastore를 활용하여 S3 or S3Compatible Storage의 데이터도 쿼리가 가능하다. 기본적으로 실시간성 처리가 아닌, HDFS or S3 or S3 Compatible Storage에 데이터를 저장하고, 데이터에 맞는 스키마를 metastore에 정의하여 질의 하는 방식 응용하여 구조화된 데이터를 hive에 저장하여 분석에 활용할 수 있다..
IT_리뷰_일상
2023. 7. 17. 11:25