Affordable Access

Komprese souborů FASTQ / FASTQ file compression

Authors
  • novák, jakub
Publication Date
Aug 27, 2020
Source
Digital Library of the Czech Technical University in Prague
Keywords
License
Unknown

Abstract

Tato práce se zabývá analýzou struktury FASTQ souborů, výběrem vhodného kompresniho algoritmu a jeho implementaci. Velká část práce se zabývá popisem algoritmu mixováni kontextů a jeho implementaci. Dále v práci popisuji výsledky provedených testováni, porovnávám je s existujicimi řešenimi a na jejich základě navrhuji dalši možná vylepšeni. Výsledný kompresni algoritmus dosahuje lepšiho kompresniho poměru než základni komprimovaci baliček GZip, který se v praxi pro ukládáni FASTQ souborů běžně použivá. Praktická část je provedena v programovacim jazyce Java a stala se součásti kompresni knihovny Small Compression Toolkit. / This thesis concerns with the analysis of a FASTQ file structure, selection of a suitable compression algorithm and its implementation. A large part of this thesis describes a context mixing algorithm and how to implement it. Furthermore, the results of performed tests are described, compared with existing solutions and possible enhancements are proposed. Implemented compression algorithm achieves better compression ratios than standard compression tool GZip, that is currently being used for storing of FASTQ files. The practical segment of this thesis is realized in the Java programming language a became part of a compression library called Small Compression Toolkit.

Report this publication

Statistics

Seen <100 times