반응형
가끔 사이즈 문제인지 binary형태로 저장된 데이터들을 본다,,.,,,,
이걸 읽으려면 파일을 읽기전에 다음과 같이 conf를 설정해준다.
sqlContext.setConf("spark.sql.parquet.binaryAsString","true")
그 이후 sqlContext.read.format("parquet").load("hdfs://path")로 읽어주면 된다.
spark 2.0대 이후 버전에서는 다음과 같이 입력해주자.
spark.conf.set("spark.sql.parquet.binaryAsString","true")
반응형
'Bigdata > Spark' 카테고리의 다른 글
spark-submit RejectedExecutionException 발생 (0) | 2020.03.06 |
---|---|
Spark(스파크) 작업이 생각보다 너무 느릴 때, repartition (0) | 2019.12.23 |
[ Spark ] sort와 order by 차이점??? (0) | 2019.07.16 |
[ Spark ] 스파크 작업 중 만난 "no space left on device" 에러 (0) | 2019.06.12 |
[ Spark ] 스파크 특정 노드에서 기존에 발생하지 않던 이슈가 발생했다면? (0) | 2019.03.27 |