반응형
현상황 : Cloudera(클라우데라) 버전(CDH 5.5.1, Parcel), Spark버전(1.5) - jdk version 1.7
필요상황 : 기존 작업을 Spark1.5(jdk1.7) - jdk 1.8로 돌리기
준비상황 : 클러스터의 각 노드들에 jdk1.8이 설치되어 있어야 함.
spark-submit스크립트에 jdk1.8 path를 명시
--conf "spark.yarn.appMasterEnv.JAVA_HOME=/home1/irteam/jdk/jdk1.8.0_141" \
--conf "spark.driverEnv.JAVA_HOME=/home1/irteam/jdk/jdk1.8.0_141" \
--conf "spark.executorEnv.JAVA_HOME=/home1/irteam/jdk/jdk1.8.0_141" \
이렇게 driver와 executor의 JAVA_HOME은 명시가 되었고
해당 스크립트가 돌아가는 client의 JAVA_HOME은 export로 변경해준다.
기존 단순 spark-submit명령어에서 앞에 다음과 같이 추가
export JAVA_HOME=/home1/irteam/jdk/jdk1.8.0_141 && spark-submit \
이렇게 설정을 해주게 되면 jdk1.8로 빌드된 코드도 기존 spark로 돌릴 수 있게 된다.
이런식의 설정으로 클라우데라 스파크 버전 또한 2점대로 높여 사용할 수 있겠다.
반응형
'Bigdata > Spark' 카테고리의 다른 글
[ Spark ] 스파크 브로드캐스트 변수 사용하기 (0) | 2018.11.21 |
---|---|
[ Spark ] 스파크 지연 평가와 장애 내구성 및 메모리 관리 (0) | 2018.11.20 |
[ Spark ] dataframe null값 0으로 변경이 잘안돼요??? (0) | 2018.09.03 |
[ Spark ] 스파크 Dataframe count중 scala.MatchError 발생 (0) | 2018.04.19 |
[ Spark ] 스파크 데이터프레임(Dataframe) partitionBy를 사용해 입맛에 맛게 저장하기 (0) | 2018.04.13 |