DCT - Grundlegendes
Um eine Kompression des Bilds zu erreichen, hat man sich folgendes Verfahren ausgedacht:
Fotografien enthalten sehr wenig scharfe Kanten (im Gegensatz zu Grafiken), d.h. wenn man das Bild vom "Zeitraum" in den "Frequenzraum" transformiert,
entstehen nur sehr wenig hochfrequente Anteile (vgl. hierzu die Anwendung der FFT beispielsweise auf Audiodaten). Das menschliche Auge ist zudem viel
empfindlicher für die Gesamthelligkeit, als für einzelne Farbübergänge.
Die wenigen hochfrequenten Anteile können deshalb sehr platzsparend gespeichert werden, ohne daß dem Betrachter ein Verlust auffällt.
Erst wenn die hochfrequenten Anteile sehr stark reduziert werden, d.h. in ihrer Genauigkeit eingeschränkt, ist ein Verlust zu bemerken. Genaueres
hierzu ist bei der Quantisierung nachzulesen.
Um die Störungen durch Rechenfehler und die benötigte Rechenzeit möglichst gering zu halten, unterteilt man dazu das gesamte Bild zuerst
in 8x8 Blöcke. Diese Blöcke werden dann im weiteren Verlauf verwendet.
Für die Teilbilder der Farbkomponenten Y, Cr und Cb wird mit Hilfe der Diskreten Cosinus Transformation DCT eine
Transformationskodierung vorgenommen. Dafür wird der Wertebereich der Pixel in das um den Nullpunkt symmetrische Invervall [-128, 127] verschoben.
Diese Blöcke mit je 8x8 verschobenen Pixelwerten werden als syx bezeichnet, wobei x und y im Bereich zwischen 0 und 7 liegen.
Für jeden transformierten Pixelwert wird jetzt die folgende FDCT (Forward-DCT) angewendet:
wobei gilt: cu, cv=
für u, v=0; bzw. sonst cu, cv=1
Insgesamt ist diese Transformation 64 mal pro Block auszuführen. Somit ergeben sich 64 Koeffizienten svu.