Formaty i metody kompresji rastrów

raster frontGIS jest jednym z tych przejawów działalności człowieka, w którym próbuje on przenieść rzeczywistość do świata cyfrowego. Wymaga to odpowiedniego zapisu, stworzenia schematu opartego na pomiarach i obserwacjach realnego obiektu, stworzenia pewnego modelu. No właśnie... I tutaj trzeba jednak przyznać, że zawsze będzie to tylko model. Choć wraz z rozwojem techniki i wiedzy o komputerach, a także z lepszym poznaniem otaczającego świata owo "tylko" może mieć całkiem satysfakcjonujący wydźwięk.

I Format rastra

Jednym z formatów zapisów danych w GIS jest raster. I to właśnie nim zajmiemy się w tym artykule. Oprócz rastra wyróżnia się oczywiście format wektorowy i formaty od niego pochodne (jak choćby TIN), a także - choć rzadko stosowane - formaty mieszane, np. GeoPDF. Wracając do rastra - zapewne każdy, kto czyta ten artykuł ma mniejsze lub większe pojęcie jak jest on zbudowany. Macierz rastrowa jest strukturą, nazwijmy to, ciągłą. Sprawia to, że bardzo często przedstawienie danego obszaru za pomocą rastra napotyka na problem zbyt wielkiej objętości danych, których w skrajnych wypadkach może nawet "nie udźwignąć" pamięć komputera lub program GIS, na którym pracujemy. Jak wiadomo - "potrzeba jest matką wynalazków" - więc i na problem objętości rastra znaleziono rozwiązanie, jakim jest jego kompresja. A że często wynalazki mają wielu ojców, to i skompresowanych formatów rastra używanych w geoinformacji jest wiele - ponad sto i podzielić je można na dwa typy. Typ pierwszy wszystkie dane oryginalne zachowuje, drugi natomiast wybiera tylko te najważniejsze. Pierwsza grupa zawiera znacznie więcej formatów.

Rastry kompresja bezstratnej

Najprostsze formaty zapisu rastrowego to BSQ (Band Sequential), BIL (Band-Interleaved-by-Pixel) oraz BIP (Band-Interleaved-by-Line). Przechowują one dane w trzech kanałach i wykorzystują do tego znaki ASCII. Różnią się między sobą w zasadzie tylko kolejnością zapisu poszczególnych elementów, a z racji swojej prostoty używane są najczęściej do zapisu nieobrobionych danych.

Nieco bardziej zaawansowanym i powszechnym (niekoniecznie jednak w geoinformacji) formatem jest bitmapa BMP. W odróżnieniu od uprzednio przedstawionych formatów, pozwala ona na dużą elastyczność zapisu oraz zastosowanie prostej bezstratnej kompresji RLE (o której w dalszej części artykułu) przy głębi kolorów sięgającej 32 bitów. Raster taki pozwala na zapisanie informacji na wielu war-stwach i w różnej rozdzielczości, z wykorzystaniem algorytmów kompresji bezstratnej lub stratnej (np. JPEG-in-TIFF). Często jest wykorzystywany do budowy numerycznych modeli terenu.

Rastry kompresji stratnej

O ile reprezentatywne rastry w poprzedniej grupie, mimo kompresji, zachowują wszystkie dane oryginalne, to rastry przedstawione poniżej już selekcjonują informacje. Piksele, które są najmniej istotne w całym zapisie, podczas kompresji stratnej są pomijane lub sztucznie obniża się ich wartość.

Najpopularniejszym formatem kompresji stratnej jest używany powszechnie JPEG oraz nowszy od niego JPEG 2000. Ten drugi charakteryzuje się lepszą jakością przy tym samym stopniu kompresji, która jest wynikiem zastosowania skomplikowanego algorytmu konwersji, a wszystko to wymaga z kolei więk-szej ilości czasu na przetwarzanie danych. JPEG zyskał popularność w geoinformacji dzięki możliwości wbudowania rastrów tego typu w pliki KML. Ten format rastrowy jest również stosowany w urządzeniach Garmina. JPEG 2000 wbudowany w plik GML jest standardem OGC (Open Geospatial Consortium), a także amerykańskiego NITF (National Imaginery Transmission Format standard).

Oba rodzaje konwersji zastosować można dla formatu MrSID, który również cechuje się dużą ela-stycznością zapisu. Jest to format, dzięki któremu można zapisywać również chmury punktów ze skaningu laserowego.

Wszystkie powyższe formaty rastrów istniały same w sobie przed tym, jak zaczęto je stosować w GIS. Przykładem rastra, który został stworzony specjalnie z myślą o GIS jest opracowany przez ER Mapper, a rozwinięty przez ERDAS Inc. format ECW (Enhanced Compression Wavelt). Zastosowana w nim technologia kompresji stratnej dąży do minimalizacji zniekształceń graficznych zdjęć lotniczych lub satelitarnych. Format ECW ma duże zastosowanie w serwisach WMS.

Wymienione wyżej formaty to namiastka całego rastrowego świata. Istnieje też duża grupa formatów zaprojektowanych specjalnie na dla konkretnych aplikacji GIS lub fotogrametrycznych. Mogą one poza informacją o wartościach poszczególnych pikseli przechowywać również metadane, palety kolorów, statystyki, dane o odwzorowaniu i inne. Wiele z nich pozwala także na piramidowy zapis warstw, który dzięki zmniejszeniu warstw oryginalnego obrazu, wpływa na poprawę wydajności sprzętu w czasie pracy. Całą listę formatów rastrowych biblioteki GDAL można zobaczyć na http://www.gdal.org/formats_list.html

II Algorytmy kompresji

Poniżej przedstawiamy trzy najbardziej popularne metody kompresji rastrów.

RLE (Run - Lenght Encoding)

Najprostsza, a co za tym idzie - najpopularniejsza metoda kompresji bezstratnej danych rastrowych. Polega na zamianie ciągów sąsiednich pikseli, które mają tą samą wartość na pary wartości oznaczających liczbę pikseli o tej samej wartości. Nadaje im przy tym jedną wartość.

Kodowanie blokowe

Dwuwymiarowa odmiana RLE, również bezstratna. W miejsce obszarów pokrytych przez komórki o tej samej wartości wstawiana jest pojedyncza wartość. Tworzy się w ten sposób raster, który składa się z bloków o możliwie największych rozmiarach. Jest on następnie dzielony na bloki coraz mniejsze, co nosi czasem nazwę struktury drzewa ćwiartkowego.

Kompresja falkowa

Wykorzystuje zasady fraktali, a więc samopodobieństwa. Poprzez działanie algorytmu dochodzi do stopniowego usuwania zbędnych informacji. Jest to więc kompresja stratna, gdzie bezpowrotnie tracona jest część informacji. Odbywa się to na drodze wielokrotnej analizy wyglądu danych w różnych skalach. Jednocześnie dąży się do zachowania wiarygodności obrazu względem oryginału. W czasie wykonywania działań można przeglądać dane rastrowe w różnych skalach i z zachowaniem odpowiedniego stopnia szczegółowości.

Przykładowym formatem wynikowym takiej konwersji jest format MrSID (Multiresolution Seam-less Image Database). Stosuje się go do zapisu zdjęć lotniczych, ale ze względu na utratę informacji w czasie kompresji często nie nadaje się do analiz i przetwarzania danych.

Metody podobne do kompresji falkowej stały się standardem w algorytmach kompresji JPEG 2000.

Więcej o standardach rastrowych można poczytać na stronach Open Geospatial Consortium: http://www.opengeospatial.org/standards/is

Źródła:

  • P. Longley, M.f.Goodchild, D.J.Maguire, D.W.Rhind, GIS Teoria i praktyka, Wydawnictwo Naukowe PWN, Warszawa 2006
  • Urbański J., "GIS w badaniach przyrodniczych", Wydawnictwo Uniwersytetu Gdańskiego , Gdańsk 2011
  •  J. Królikowski, Piksel, jaki jest..., w: Geodeta, magazyn geoinformacyjny nr 1 (176), styczeń 2010

Szymon Rabiej

Nasze patronaty

XXIII Ogólnopolskie Sympozjum Fotogrametryczno-Teledetekcyjne
18-20 września 2024
INTERGEO 2023
10-12 października 2023
VIII Forum BioGIS
29-30.11.2023
GIS Day w Stolicy
23 listopada 2023

Quizy mapowe

Gdzie leży ten kraj?
Puzzle z mapą świata
Jaki to kraj?
Quiz WORLDLE - Jaki to kraj?
Wersja dla zaawansowanych
Geoquiz historyczny
EOGuesser