Exception during loading of vcf.gz file #1

ddemaeyer · 2016-11-29T14:18:53Z

Version VCFComp 0.4.0 using Adam 17.1

Loading a gzipped vcf file results in
aG_1: org.apache.spark.rdd.RDD[org.tmoerman.adam.fx.avro.AnnotatedGenotype] = MapPartitionsRDD[2] at filter at :53
htsjdk.tribble.TribbleException: Input stream does not contain a BCF encoded file; BCF magic header info not found, at record 0 with position 0:
at htsjdk.variant.bcf2.BCF2Codec.error(BCF2Codec.java:492)
at htsjdk.variant.bcf2.BCF2Codec.readHeader(BCF2Codec.java:153)
at org.seqdoop.hadoop_bam.BCFSplitGuesser.(BCFSplitGuesser.java:107)
at org.seqdoop.hadoop_bam.BCFSplitGuesser.(BCFSplitGuesser.java:88)
at org.seqdoop.hadoop_bam.VCFInputFormat.addGuessedSplits(VCFInputFormat.java:254)
at org.seqdoop.hadoop_bam.VCFInputFormat.fixBCFSplits(VCFInputFormat.java:242)
at org.seqdoop.hadoop_bam.VCFInputFormat.getSplits(VCFInputFormat.java:221)
at org.apache.spark.rdd.NewHadoopRDD.getPartitions(NewHadoopRDD.scala:120)
at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)
at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)
at scala.Option.getOrElse(Option.scala:120)
at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)

Loading the VCF file after unzipping works.

This is probably related with HadoopGenomics/Hadoop-BAM#70

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Exception during loading of vcf.gz file #1

Exception during loading of vcf.gz file #1

ddemaeyer commented Nov 29, 2016

Exception during loading of vcf.gz file #1

Exception during loading of vcf.gz file #1

Comments

ddemaeyer commented Nov 29, 2016