Komprese dat (také komprimace) je zpracování počítačových dat s cílem zmenšit jejich objem při současném zachování informací v nich obsažených. Komprese se dělí na ztrátovou a bezztrátovou. Článek se zabývá také použitím komprese a komprimačními programy.

Předchozí okruh: 22. Počítačové viry a ochrana

Komprese dat

  • zpracování počítačových dat s cílem zmenšit jejich objem při současném zachování informací v datech obsažených
  • opakem je dekomprese, tedy rozbalení dat
  • kodeky
    • KOmprese a DEKomprese
    • software, který dokáže transformovat datový proud nebo signál
    • ukládá data do zakódované formy (většinou za účelem přenosu, uchovávání nebo šifrování) a poté obnovují do přesné nebo přibližné původní formy vhodné pro zobrazování, případně jinou manipulaci

Bezztrátová komprese dat

  • soubor lze rekonstruovat do původní podoby
  • není tak účinná jako ztrátová komprese
  • nejlepší využití u textu
  • archivní soubory
    • komprese sloučí vybrané soubory do tzv. archivu (obvykle bezztrátovou kompresí)
    • archiv je soubor složený z jednoho nebo více souborů a metadatech o nich
    • můžou být částečně nebo úplně zašifrované
    • používají se k uložení více souborů pohromadě do jednoho souboru pro snazší přenositelnost a skladování
    • přípony .zip, .rar, .7z
  • bezztrátové kompresní formáty
    • audio
      • flac
    • obraz
      • gif, png (vždy bezeztrátové)
      • jpeg 2000, tiff (mají bezztrátové varianty)
    • video
      • lagarith
  • algoritmus RLE (run-lenght encoding)
    • kóduje posloupnosti stejných hodnot do dvojic (délka posloupnosti a hodnota)
    • aaabccccddeee => 3a1b4c2d3e
    • účinnost silně závislá na vstupních datech
  • algoritmus LZ77
    • slovníkový algoritmus
    • prochází data, v případě, že narazí na skupinu znaků, která se již v předchozích datech objevila, nahradí tuto skupinu znaků odkazem na předchozí výskyt
    • odkaz je zakódován jako vzdálenost od současné pozice a délka skupiny znaků
    • pokud je odkaz kratší než reprezentace skupiny znaků, dochází k úspoře místa
  • Huffmanovo kódování
    • znaky, které se v souboru vyskytují nejčastěji, jsou konvertovány do bitových řetězců s nejkratší délkou, zatímco znaky, které se vyskytují zřídka, jsou konvertovány do delších řetězců

Ztrátová komprese dat

  • některé informace jsou nenávratně ztraceny
  • výrazně účinnější
  • používá se zejména u obrazu, videa a zvuku, kde lidské smysly zásadní rozdíl nepostřehnou, a kde není potřeba uchovat všechna data
  • obraz
    • vhodná pro fotografie s hladkými přechody
    • nevhodná pro grafiku obsahující text
    • např. formát jpeg
  • videa
    • komprese videa probíhá tak, že se místo celých snímků uchovávají pouze změny mezi po sobě jdoucími snímky
  • zvuk
    • ztrátová komprese zvuku probíhá tak, že se ořezávají všechny frekvence vyšší než je daná mez (např. 7,5 kHz u mp3)
    • LAME (kodek pro mp3)
    • výsledná velikost souboru zhruba 10-20 % původního při zachování relativně dobré kvality

Komprimační programy

  • WinRAR
    • pouze pro Windows
    • nekonečná trial verze
  • 7-Zip
    • oblíbený svobodný software
    • pro Windows, Linux i macOS
  • WinZip
    • sharewarový archivační a kompresní program
    • pro Windows, Linux, macOS i Android
  • dnes už jsou kompresní algoritmy zakomponované do kodeků a formátů, speciální komprimační programy většinou nejsou potřeba

Následující okruh: 24. Teorie programování

Kategorie: Okruhy

0 komentářů

Napsat komentář

Zástupce avatara

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *