Dateiformate

Dateiformate

Dateiformate legen die Regeln fest wie und welche Daten auf einem Speichermedium codiert werden. Allgemein lassen sie sich in folgende Kategorien unterteilen:

 

programmspezifische Formate orientieren sich an den Erfordernissen einzelner Programme und lassen sich oft nur von diesen interpretieren. Illustrator, Photoshop, ClarisCAD…
betriebssystemspezifische Formate dienen als Austauschformate zwischen verschiedenen Programmen innerhalb eines Betriebssystems. (Zwischenablage) PICT, BMP…
Austauschformate Als standardisierte Formate dienen sie dem Austausch zwischen verschiedenen Programmen und Betriebssystemen.
Als Austauschfomate im professionellen Bereich sind sie auf die Qualität optimiert.
TIFF, EPS…
Formate für inline-Grafiken Formate, die durch WWW-Browser interpretiert werden können. Weil diese Formate zur Übertragung in den Kommunikationsnetzen verwendet werden sind sie optimiert auf die Speichergröße. JPEG, GIF…

Desweiteren lassen sich Grafik-Dateiformate in Formate unterscheiden die pixelorientierte Informationen sichern und solche die Objektdaten speichern.

objektorientierte Formate

Konstruktionsprogramme (CAD) und grafische Informationssysteme (GIS) legen ihre Daten oft in Datenbankformaten (z.B. DXF) ab, die die einzelnen Objekte und deren Atrribute beschreiben. Das sichert einen exakten Zugriff auf die einzelnen Objekte und ermöglicht eine automatische Bearbeitung.

Layout Programme und „freie“ Grafiken bedienen sich als Formatkonvention der Seitenbeschreibungssprache PostScript. Das davon abgeleitete Dateiformat heißt EPS (Encapsulated PostScript).
Hier ein Ausschnitt aus einer Zeichnung, die im EPS Format gesichert und in einem Texteditor geöffnet wurde:

%%BeginResource: procset Altsys_header 4 0
userdict begin /AltsysDict 245 dict def end
AltsysDict begin
/bdf{bind def}bind def
/xdf{exch def}bdf
/defed{where{pop true}{false}ifelse}bdf
/ndf{1 index where{pop pop pop}{dup xcheck{bind}if def}ifelse}bdf
/d{setdash}bdf
/h{closepath}bdf
/H{}bdf
/J{setlinecap}bdf
/j{setlinejoin}bdf
/M{setmiterlimit}bdf
/n{newpath}bdf
/N{newpath}bdf
/q{gsave}bdf
/Q{grestore}bdf
/w{setlinewidth}bdf
/sepdef{
dup where not
{
AltsysSepDict
}

Viele Schriftfonts sind ebenfalls als Post-Skript-Dateien abgelegt.

Genaugenommen bestehen EPS-Dateien aus zwei Teilen: der eigentlichen PostSkript-Beschreibung und einer reduzierten PICT oder TIFF-Darstellung für die Bildschirmanzeige und können daher recht groß werden. Zusätzlich bietet das Format für den professionellen Einsatz die Möglichkeit Rastereinstellungen und Druckerkennlinien zusammen mit dem Bild zu sichern.
(Die PostSkript-Beschreibung zerfällt in verschiedene Dialekte und kann als binäres EPS im 8-Bit Format oder als ASCII-EPS im 7-Bit Format vorliegen).

pixelorientierte Formate

Pixelorientierte Formate sichern eine bestimmte Informationsmenge für jeden Bildpunkt. Hier ein Ausschnitt aus einem Dokument, das in TIFF gesichert und mit einem Texteditor geöffnet wurde. Die Darstellung zeigt in der ersten Spalte Zeilennummern, gefolgt von der hexadezimalen Darstellung für jeden Bildpunkt:

0300: FF 80 00 A0 00 BE A0 00 D9 A0 00 8C 08 00 08 22
0310: 01 55 00 D9 FF 00 22 01 55 00 D6 FF 00 22 01 55
0320: 00 D3 FF 00 22 01 55 00 D0 FF 00 22 01 55 00 CD
0330: FF 00 22 01 55 00 CA FF 00 22 01 55 00 C7 FF 00
0340: 22 01 55 00 C4 FF 00 22 01 55 00 C1 FF 00 22 01
0350: 55 00 BE FF 00 22 01 55 00 BB FF 00 22 01 55 00
0360: B8 FF 00 22 01 55 00 B5 FF 00 22 01 55 00 B2 FF
0370: 00 22 01 55 00 AF FF 00 22 01 55 00 AC FF 00 22
0380: 01 55 00 A9 FF 00 22 01 55 00 A6 FF 00 22 01 55
0390: 00 A3 FF 00 22 01 55 00 A0 FF 00 22 01 55 00 9D
03A0: FF 00 22 01 55 00 9A FF 00 22 01 55 00 97 FF 00
03B0: 22 01 55 00 94 FF 00 22 01 55 00 91 FF 00 22 01
03C0: 55 00 8E FF 00 22 01 55 00 8B FF 00 22 01 55 00
03D0: 88 FF 00 22 01 55 00 85 FF 00 22 01 55 00 82 FF
03E0: 00 22 01 55 00 7F FF 00 22 01 55 00 7C FF 00 22
03F0: 01 55 00 79 FF 00 22 01 55 00 76 FF 00 22 01 55

Datenkompression und Datenreduktion

Da beim pixelorientierten Verfahren sehr schnell sehr große Datenmengen zusammenkommen, verwenden viele Formate Kompresionsmethoden bei der Speicherung. Dabei unterscheidet man zwischen verlustfreier Kodierung, auch Datenkompression genannt, und der Datenreduktion, die eine verlustbehaftete Kodierung darstellt. Die Datenkompression faßt die Redundanzen eines Bildes zusammen und erlaubt bei der Dekodierung eine vollständige Wiederherstellung des Bildes. Bei der Datenreduktion werden irrelevante Informationen aus dem Bild getilgt. Je nach Stärke der Reduktion kann die Qualität des Bildes leiden. Eine vollständige Wiederherstellung des Ursprungsbildes ist hier nicht mehr möglich.

Das einfache Apple Macintosh eigene PICT-Format verwendet für diese Aufgabe (wie auch FAX-Geräte) die Lauflängenkodierung (RLE / Runlength Encoding) als Kompressionsmethode. Diese Methode ist verlustfrei, d.h. die Informationen werden beim Dekodieren wieder vollständig hergestellt. Hierbei werden identische Bildpunktfolgen oder wiederkehrende Muster zusammengefaßt indem nur einmal deren Aussehen und die Häufigkeit ihres Auftretens gespeichert wird. Deshalb ist diese Methode auch bei Strichzeichnungen (Kompression ca. 1:10) effektiver als bei vielteiligen Fotos (1:2).

TIFF (Tag Image File Format), als pixelorientiertes Speicherformat für den professionellen Einsatz, verwendet die LZW Kompressionsmethode (nach ihren Entwicklern Limple, Ziv und Welch). Auch diese Methode arbeitet verlustfrei mit Mustertabellen. Hier wurde versucht einen Kompromiß zwischen Effizienz der Kompression und Geschwindigkeit beim Komprimieren/Dekomprimieren zu finden.

Für den Einsatz in elektronischen Medien, z.B. im WWW und damit als Austauschformate zwischen den unterschiedlichsten Computersystemen eignen sich die Formate GIF und JPEG. Da Datenübertragung langsam und teuer ist konzentrieren sich diese Formate besonders darauf die entstehenden Dateigrößen klein zu halten.

GIF (Graphics Interchange Format von Compuserve) wurde von Compuserve entwickelt um die Datenraten im eigenen Onlie-Dienst gering zu halten. Dieses Format verzichtet auf eine Echtfarbenspeicherung und reduziert die Farbinformationen stattdessen auf eine Farbtabelle von maximal 256 Farben. In einem Dialekt von GIF (GIF89a) läßt sich eine Farbe als „transparent“ definieren und es lassen sich mehrere Bilder zu einer animierten Sequenz zusammenstellen und in einer gemeinsamen Datei speichern; Zugeständnisse an die Gestaltungsbedürfnisse in den elektronischen Medien.

PNG (Portable Network Graphics, gesprochen:“ping“) wird zur Zeit als Nachfolger von GIF vom WWW-Konsortium als Antwort auf die Lizenzstrategie von Compuserve etabliert. Es unterstützt Farbtiefen von 1 bis 48 bit, neben Transparenz auch einen echten alpha-Kanal und speichert auch Metainformationen zu den Bildern (Autor, Titel, Stichwörter etc.).

JPEG, benannt nach der von der internationalen Standardisierungsorganisation ISO eingesetzten Joint Pictures Expert Group, ist in der Lage Millionen von Farben zu sichern und verwendet ein ausgesprochen elaboriertes Reduktionsverfahren mit dem selben Namen.

Dies Verfahren kann zwischen verlustfreier Kompression und verschiedenen Qualitäten verlustbehafteter Datenreduktion variieren, schadet der Qualität des Bildes jedoch kaum, da sie auf die menschliche Wahrnehmung eingestellt ist. Da sich sich zwei nebeneinanderliegende Pixel mit gleicher Helligkeit (Luminanz) aber unterschiedlicher Farbe (Chrominanz) kaum voneinander unterscheiden lassen, können die Farbinformationen stärker (um 1/4) als die Helligkeitsinformationen (um 1/8) reduziert werden. Danach wird das Bild in Kacheln von 8 mal 8 Pixeln unterteilt und die Helligkeits- und Farbverteilung in diesen Kacheln nährungsweise als mathematische Funktion beschrieben (DCT / Diskrete Cosinustransformation).

Systematisierung