Spark exception: when executing strings

Question

Spark exception: when executing strings

I read text files and convert them to parquet files. I am doing this using spark code. But when I try to run the code, I get the following exception

org.apache.spark.SparkException: Job aborted due to stage failure: Task 2 in stage 1.0 failed 4 times, most recent failure: Lost task 2.3 in stage 1.0 (TID 9, XXXX.XXX.XXX.local): org.apache.spark.SparkException: Task failed while writing rows.
    at org.apache.spark.sql.sources.InsertIntoHadoopFsRelation.org$apache$spark$sql$sources$InsertIntoHadoopFsRelation$$writeRows$1(commands.scala:191)
    at org.apache.spark.sql.sources.InsertIntoHadoopFsRelation$$anonfun$insert$1.apply(commands.scala:160)
    at org.apache.spark.sql.sources.InsertIntoHadoopFsRelation$$anonfun$insert$1.apply(commands.scala:160)
    at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:63)
    at org.apache.spark.scheduler.Task.run(Task.scala:70)
    at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:213)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
    at java.lang.Thread.run(Thread.java:745)
Caused by: java.lang.ArithmeticException: / by zero
    at parquet.hadoop.InternalParquetRecordWriter.initStore(InternalParquetRecordWriter.java:101)
    at parquet.hadoop.InternalParquetRecordWriter.<init>(InternalParquetRecordWriter.java:94)
    at parquet.hadoop.ParquetRecordWriter.<init>(ParquetRecordWriter.java:64)
    at parquet.hadoop.ParquetOutputFormat.getRecordWriter(ParquetOutputFormat.java:282)
    at parquet.hadoop.ParquetOutputFormat.getRecordWriter(ParquetOutputFormat.java:252)
    at org.apache.spark.sql.parquet.ParquetOutputWriter.<init>(newParquet.scala:83)
    at org.apache.spark.sql.parquet.ParquetRelation2$$anon$4.newInstance(newParquet.scala:229)
    at org.apache.spark.sql.sources.DefaultWriterContainer.initWriters(commands.scala:470)
    at org.apache.spark.sql.sources.BaseWriterContainer.executorSideSetup(commands.scala:360)
    at org.apache.spark.sql.sources.InsertIntoHadoopFsRelation.org$apache$spark$sql$sources$InsertIntoHadoopFsRelation$$writeRows$1(commands.scala:172)
    ... 8 more

I am trying to write a data frame as follows:

dataframe.write().parquet(Path)

Any help is much appreciated.

+6

java hadoop apache-spark apache-spark-sql parquet

Aditya calangutkar Mar 16 '16 at 11:52

source share

5 answers

Carlos Bribiescas · Answer 1 · 2017-02-01T19:21:33+0000

Another possible reason is because you are pushing s3 request rate limits. If you look closely at your magazines, you can see something like this

AmazonS3Exception: Please reduce your request rate.

So far, the Spark user interface will say

Task failed while writing rows

, , , . .

leo9r · Answer 2 · 2016-07-29T02:46:27+0000

, . , . , .

sparkConf.set("spark.speculation","false")

Steve Loughran · Answer 3 · 2017-02-02T15:06:44+0000

, : IDE, , . , init/config

Julien Nyambal · Answer 4 · 2018-05-14T11:27:15+0000

- , , , , hadoop. , , hadoop .

Michal Ficek · Answer 5 · 2019-02-11T15:16:55+0000

, hdfs, . , . , , hdfs.

Spark exception: when executing strings

More articles: