Kodowanie arytmetyczne

Kodowanie arytmetyczne

Kodowanie arytmetyczne – metoda kodowania źródłowego dyskretnych źródeł sygnałów , stosowana jako jeden z systemów w bezstratnej kompresji danych. Została wynaleziona przez Petera Eliasa około 1960 roku.

Ideą tego kodu jest przedstawienie ciągu wiadomości jako podprzedziału przedziału jednostkowego [0,1) wyznaczonego rekursywnie na podstawie prawdopodobieństw wystąpienia tychże wiadomości generowanych przez źródło. Ciąg kodowy reprezentujący kodowane wiadomości jest binarnym zapisem wartości z wyznaczonego w ten sposób przedziału.

Można udowodnić, że przy wyborze odpowiednio długiego ciągu wiadomości do zakodowania, średnia liczba symboli na wiadomość jest mniejsza od H(X) + 2, gdzie H(X) jest entropią źródła, lecz co najmniej równa samej entropii.

Spis treści

1 Algorytm kodowania
- 1.1 Przykład 1.
- 1.2 Przykład 2.
2 Dekodowanie
- 2.1 Przykład
3 Praktyczne implementacje
4 Bibliografia
5 Zobacz też

Algorytm kodowania

Dany jest zbiór symboli $S = \{x_1, x_2, \ldots\}$ oraz stowarzyszony z nim zbiór prawdopodobieństw $p = \{p_1, p_2, \ldots\}$ . Jeden z symboli jest wyróżniony – jego wystąpienie oznacza koniec komunikatu, co zapobiega wystąpieniu niejednoznaczności; ewentualnie zamiast wprowadzenia dodatkowego symbolu można przesyłać długość kodowanego ciągu.

Na początku dany jest przedział $P = [0,1)$ , który dzielony jest na podprzedziały o szerokościach równych kolejnym prawdopodobieństwom $p i$ , czyli otrzymywany jest ciąg podprzedziałów $[0, p_1), [p_1, p_1 + p_2), [p_1 + p_2, p_1 + p_2 + p_3), [p_1 + p_2 + p_3, p_1 + p_2 + p_3 + p_4), \ldots$ . Kolejnym podprzedziałom (ozn. $R i$ ) odpowiadają symbole ze zbioru $S$ .

Algorytm kodowania:

Dla kolejnych symboli c:
- Określ, który podprzedział bieżącego przedziału $P$ odpowiada literze c – wynikiem jest $R i$ .
- Weź nowy przedział $P : = R i$ – następuje zawężenie przedziału
- Podziel ten przedział $P$ na podprzedziały w sposób analogiczny do tego, jak to miało miejsce na samym początku (chodzi o zachowanie proporcji szerokości podprzedziałów).
Zwróć liczbę jednoznacznie wskazującą przedział $P$ (najczęściej dolne ograniczenie, albo średnia dolnego i górnego ograniczenia).

Przykład 1.

Na rysunku pokazano, jak zmienia się aktualny przedział $P$ w trzech pierwszych krokach kodowania. Kodowane są trzy symbole z czteroelementowego zbioru o prawdopodobieństwach $p = {0,6;0,2;0,1;0,1}$ , w kolejności: pierwszy, trzeci, czwarty.

Przykład 2.

Niech $S = \{a, b, c, \#\}$ ( $\#$ – koniec komunikatu), prawdopodobieństwa $p = {0,45,0,3,0,2,0,05}$ .

Zakodowany zostanie ciąg $caba\#$ .

Początkowo przedział $P = [0,1)$ , jest on dzielony na podprzedziały $[0,0,45),[0,45,0,75),[0,75,0,95),[0,95,1)$ .
Pierwszym kodowanym symbolem jest $c$ , któremu odpowiada 3. podprzedział, zatem $P : = R 3 = [0,75,0,95)$ . Nowy przedział znów jest dzielony: $[0,75,0,84),[0,84,0,9),[0,9,0,94),[0,94,0,95)$ .
Kolejnym kodowanym symbolem jest $a$ , któremu odpowiada 1. podprzedział, zatem $P : = R 1 = [0,75,0,84)$ . Nowy przedział znów jest dzielony: $[0,75,0,7905),[0,7905,0,8175),[0,8175,0,8355),[0,8355,0,84)$ .
Kolejnym kodowanym symbolem jest $b$ , któremu odpowiada 2. podprzedział, zatem $P : = R 2 = [0,7905,0,8175)$ . Nowy przedział znów jest dzielony: $[0,7905,0,80265),[0,80265,0,81075),[0,81075,0,81615),[0,81615,0,8175)$ .
Kolejnym kodowanym symbolem jest (ponownie) $a$ , któremu odpowiada 1. podprzedział, zatem $P : = R 1 = [0,7905,0,80265)$ . Nowy przedział znów jest dzielony: $[0,7905,0,795968),[0,795968,0,799612),[0,799612,0,802042),[0,802042,0,80265)$ .
Kolejnym kodowanym symbolem jest $\#$ , kończący kodowanie, któremu odpowiada 4. podprzedział, zatem $P : = R 4 = [0,802042,0,80265)$ .
Na wyjście zostaje zapisana liczba identyfikująca ten przedział – może to być, jak wspomniano, jego dolne ograniczenie, czyli 0,802042.

Dekodowanie

Dekodowanie przebiega prawie tak samo. Różnica polega na tym, że przy kodowaniu kolejne litery jednoznacznie określały podprzedziały, przy dekodowaniu natomiast wybierany jest ten podprzedział, do którego należy kodująca liczba. Wybranie podprzedziału powoduje wypisanie powiązanego z nim symbolu.

Formalnie algorytm przebiega następująco:

$x$ – liczba (kod)
$P = [0,1)$
Wykonuj w pętli:
- Podziel $P$ na podprzedziały $R i$
- Znajdź podprzedział $R i$ , do którego należy $x$ .
- $P : = R i$
- Wypisz i-ty symbol na wyjście
- Jeśli i-ty symbol był symbolem końcowy, zakończ pętlę

Przykład

Na rysunku poniżej pokazano pierwsze trzy kroki dekodowania liczby 0,538 (zaznaczonej kropką na osi liczbowej); prawdopodobieństwa symboli: $p = {0,6,0,2,0,1,0,1}$ . W pierwszej iteracji $P = [0,1)$ – liczba 0,538 znajduje się w pierwszym przedziale, a zatem wypisany zostanie pierwszy symbol, a $P : = R 1 = [0,0,6]$ . Teraz 0,538 znajduje się w przedziale 3., wypisany zostanie symbol 3., a $P = R 3 = [0,48,0,54]$ itd.

Praktyczne implementacje

Podstawowy algorytm, dość wolny jednak, generuje kolejne bity rozwinięcia dwójkowego. O wiele lepsza realizacja opiera się w całości na działaniach na liczbach całkowitych.

Bibliografia

Adam Drozdek, Wprowadzenie do kompresji danych, WNT 1999

Zobacz też

Inne hasła zawierające informacje o "Kodowanie arytmetyczne":

Jajko w kulturze ...

Historia nauki ...

Claude E. Shannon ...

Algorytm genetyczny ...

Ciąg arytmetyczny ...

Kodowanie arytmetyczne Kodowanie arytmetyczne – metoda kodowania źródłowego dyskretnych źródeł sygnałów , stosowana jako jeden ...

Kompresja (informatyka) statyczne.Czasami, np. w algorytmie PNG , stosowane są modele pośrednie. Algorytmy kompresji bezstratnej Kodowanie Huffmana Kodowanie arytmetyczne Kodowanie Shannona , Shannona-Fano LZ77 , LZSS , LZP LZ78 , LZW , LZMW , LZAP LZMA PNG RLE PPM Deflate Bzip2 (oparty m.in. o ...

Kryptologia ...

Unicode ...

Mitochondrium ...

Inne lekcje zawierające informacje o "Kodowanie arytmetyczne":

Pierwiastki (plansza 9) ...

Sieci komputerowe - Warstwowy model OSI (plansza 5) ...

Algorytmy genetyczne (plansza 31) ...

Publikacje nauczycieli

Logowanie i rejestracja

Załóż nowe konto za darmo » Odzyskaj stracone hasło

Czy wiesz, że...

W 1995 roku w Osztynie ten sam gracz lotto trafił dwie "szóstki" w odstępie dwóch tygodni.

losowanie lotto wygrana

Rodzaje szkół

AP Edukacja - licea
i szkoły policealne

Publikacje nauczycieli

Kontakt

Formularz dodania
szkoły do katalogu

Ogólnopolski Katalog Szkolnictwa
www.szkolnictwo.pl
ul. Kaszubska 10/16
75-036 Koszalin

Wszelkie pytania, uwagi i zmiany w katalogu prosimy kierować do:

	zmiany@szkolnictwo.pl

Wszelkie pytania, uwagi dotyczące Platformy Edukacyjnej prosimy kierować do:

	platforma@szkolnictwo.pl

Konta bankowe dla klientów katalogu szkolnictwo.pl:

Pełny ekran >>>

Wiadomości

Reklama

zamów reklamę >>>

Dodaj szkołę

Formularz dodania
szkoły do katalogu

Nauka

	Język angielski
Słówka - testy Słówka - lekcje Testy po angielsku Gimnazjum - lekcje Gimnazjum - testy do lekcji Liceum - lekcje Liceum - testy do lekcji

	Testy na prawo jazdy
Kategoria B - lekcje Kategoria B - testy do lekcji Testy do egzaminu

	Język niemiecki
Słówka - testy Słówka - lekcje Gimnazjum - lekcje Gimnazjum - testy do lekcji Liceum - lekcje Liceum - testy do lekcji

	Matematyka
Gimnazjum - lekcje Gimnazjum - testy do lekcji Liceum - lekcje Liceum - testy do lekcji Konkurs "Kangur Matematyczny"

	Geografia
Gimnazjum - lekcje Gimnazjum - testy do lekcji Liceum - lekcje Liceum - testy do lekcji Państwa świata

	Chemia
Gimnazjum - lekcje Gimnazjum - testy do lekcji Liceum - lekcje Liceum - testy do lekcji

	Język hiszpański
Słówka

	Prawo
Egzamin konkursowy dla kandydatów na aplikantów

	Język polski
Liceum - lekcje Liceum - testy do lekcji Liceum - testy do lektur Gimnazjum - lekcje Gimnazjum - testy do lekcji Ortografia - testy

	Historia
Liceum - lekcje Liceum - testy do lekcji Gimnazjum - lekcje Gimnazjum - testy do lekcji

	Biologia
Gimnazjum - lekcje Gimnazjum - testy do lekcji Liceum - lekcje Liceum - testy do lekcji

	Fizyka i astronomia
Zadania do matury Gimnazjum - lekcje Gimnazjum - testy do lekcji Liceum - lekcje Liceum - testy do lekcji

	Informatyka
Informatyka - zadania do matury Gimnazjum - lekcje Gimnazjum - testy do lekcji Liceum - lekcje Liceum - testy do lekcji

	Wiedza o społeczeństwie
Liceum - lekcje Liceum - testy do lekcji

	Podstawy przedsiębiorczości
Liceum - lekcje Liceum - testy do lekcji

	Język angielski
	Filozofia
	Testy na prawo jazdy
	Język niemiecki
	Matematyka
	Geografia
	Chemia
	Język hiszpański
	Prawo
	Język polski
	Historia
	Biologia
	Fizyka i astronomia
	Informatyka
	Wiedza o społeczeństwie
	Podstawy przedsiębiorczości
	Egzaminy Zawodowe
	Materiały szkół