[빅데이터] Linux환경에 Spark 설치하여 예제를 돌려보자
Linux환경에 Spark 설치하여 예제를 돌려보자 Spark이란? Apache Spark 이름에서 알수 있듯이 Apache 소프트웨어 재단에서 만들어진 오픈소스로, 인메모리 내에서 빅데이터를 분석하는 오픈소스 병렬처리 프레임워크이다. 설치 환경은 OS : CentOS7 linux 설치전 사전 필요한 사항은 Python library가 필요하다. yum 명령어를 통해 python을 설치한다. (내부망일 경우 rpm 등을 이용하여 자체 설치) 공식 spark 홈페이지에서 spark download 한다. (원하는 버전으로) spark.apache.org/downloads.html Downloads | Apache Spark Download Apache Spark™ Choose a Spark release:..
IT_리뷰_일상
2023. 7. 6. 14:47