Dissertation
Uwe Rauschenbach: Bedarfsgesteuerte Bildübertragung mit Regions of Interest und Levels of Detail für mobile Umgebungen. Dissertation, Universität Rostock, Ingenieurwissenschaftliche Fakultät, 5. Mai 2000.
Gutachter
- Prof. Dr.-Ing. habil. Heidrun Schumann, Universität Rostock
- Prof. Dr.-Ing. Dr. h.c. Dr. E.h. José Luis Encarnação, TU Darmstadt
- Prof. Dr. rer. nat. Dieter Schütt, SIEMENS AG, München
Datum der Verteidigung: 5. Oktober 2000
Download
Volltext (PDF, 10 MB)Volltext (Postscript gzip komprimiert, 13 MB)
Kurzfassung
Mit der zunehmenden Verbreitung portabler Rechner und GSM-basierter Datenfunkeinrichtungen erlangt die Übertragung und Darstellung von Rasterbildern auch in mobilen Umgebungen eine wachsende Bedeutung. In solchen Umgebungen stellen geringe Übertragungsbandbreite und eingeschränkte Displayfläche begrenzende Faktoren für den Transfer und die Anzeige großer Bilder dar.
In dieser Arbeit wurde ein formales Modell der bedarfsgesteuerten Bildübertragung entwickelt, das es erlaubt, vor und während der Übertragung für wählbare Regionen im Bild (so genannte Regions of Interest - RoI) die benötigte Detaillierungsstufe (Level of Detail - LoD) festzulegen und redundanzfrei eine Verfeinerung von Bereichen bereits übertragener Bilder vorzunehmen. Auf der Grundlage des Modells wurde ein waveletbasiertes Kodierungs- und Übertragungsverfahren realisiert, bei dem ein neuartiges Wavelet-Zerlegungsschema zum Einsatz kommt.
Es werden verschiedene Anwendungen der bedarfsgesteuerten Bildübertragung exemplarisch vorgestellt. Neben Systemen zur Unterstützung der Benutzerrollen Bildautor und Bildbetrachter wurde die neue Fokus-und-Kontext-Technik RECHTECKIGER FISHEYE-VIEW zur kombinierten Übertragung und Anzeige großer Bilder entwickelt, die Bildschirmfläche und Netzbandbreite effizient ausnutzt.
Für die spezielle Bildklasse Farbtabellenbilder wurde ein Kodierungsverfahren entworfen und umgesetzt, das sich durch eine progressive Verfeinerung der Farbtiefe auszeichnet. Es ermöglicht dadurch im Vergleich zu den Standardverfahren interlaced PNG und interlaced GIF eine frühere Erkennbarkeit feiner Details im Übertragungsverlauf und erzielt trotzdem überlegene bzw. gleichwertige Kompressionsraten.
Thesen
- Übertragung und Darstellung von Rasterbildern erlangen mit der zunehmenden Verbreitung portabler Rechner und GSM-basierter Datenfunkeinrichtungen auch in mobilen Umgebungen wachsende Bedeutung. In solchen Umgebungen stellen geringe Übertragungsbandbreite und eingeschränkte Displayfläche begrenzende Faktoren für Transfer und Anzeige großer Bilder dar, zu deren Handhabung neue Konzepte erforderlich sind.
- Existierende Systeme zur adaptiven Bildübertragung ermöglichen durch Steuerung der Kodierung die Anpassung von Größe und Bandbreitenbedarf eines Bildes vor der Übertragung an die aktuelle Ressourcensituation, den Kontext. Reaktionen auf Kontextänderungen während laufender Übertragung sind jedoch nicht möglich. Bedarfsgesteuerte Bildübertragung erlaubt es dem Benutzer darüber hinaus, vor und während der Übertragung für wählbare Regionen im Bild (so genannte Regions of Interest) die benötigte Detaillierungsstufe (Level of Detail) festzulegen. Die Umsetzung dieses Konzeptes erfolgt durch hybride Lösungsansätze, bei der Bildkompressionsverfahren mit Regions of Interest und Levels of Detail kombiniert werden.
- Das entwickelte formale Modell für Regions of Interest und Levels of Detail in der Rasterbildübertragung ermöglicht eine exakte Spezifikation des Übertragungsbedarfes und bildet die Grundlage für die Umsetzung einer redundanzfreien Verfeinerung. Eine Region of Interest (RoI) repräsentiert dabei eine zusammenhängende Pixelmenge im Bild. Die zu übertragende Detaillierungsstufe (LoD) einer RoI kann als Kombination der Merkmale X-Auflösung, Y-Auflösung, Genauigkeit und Farbe spezifiziert werden. Für die Übertragung ist jede RoI einzeln priorisierbar.
- Als Basis der bedarfsgesteuerten Bildübertragung wird eine Erweiterung des Embedded-Zerotree-Wavelet-Kompressionsverfahren vorgeschlagen. Dieses bietet gegenüber dem JPEG-Standard die Vorteile einer höheren Bildqualität bei niedrigen Bitraten, einer höheren erreichbaren Kompressionsrate, einer feinstufigen Skalierung der Bitrate und einer einfacheren Integration von RoIs durch bessere Lokalisierung. Es erfordert jedoch einen höheren Rechenaufwand.
- Bei Verwendung des etablierten dyadischen Wavelet-Zerlegungsschemas kann die X-Auflösung minimal das Halbe und maximal das Doppelte der Y-Auflösung betragen. Für bestimmte Bildübertragungsanwendungen ist jedoch eine höhere Flexibilität erforderlich. Das vorgeschlagene XY-unabhängige Dekompositionsschema ermöglicht größere Abweichungen zwischen X- und Y-Auflösung, die für bestimmte Applikationen Effizienzgewinne bringen. Da das neue Schema auch zusätzliche Kosten hinsichtlich Rechenzeit, Speicherplatz und Artefakten verursacht, wird es nur in solchen Anwendungen benutzt, in denen der Effizienzgewinn die Kosten überwiegt.
- Der entwickelte und implementierte waveletbasierte MoviRoILoD-Algorithmus zur bedarfsgesteuerten Übertragung von Graustufen- und Echtfarbbildern ermöglicht es, mithilfe von RoI-Schedulern Kodierung und Dekodierung zu steuern. Dabei gestattet er die Einbettung von Steuerkommandos in den kodierten Datenstrom, um auch während einer laufenden Übertragung flexibel auf Bedarfsänderungen zu reagieren. Der Übertragungsbedarf kann somit sowohl im Vorfeld der Übertragung als auch während laufender Übertragung spezifiziert werden, indem durch eine Verfeinerungsanforderung neue RoIs definiert oder die Detaillierungsstufe bzw. Priorität existierender RoIs modifiziert werden.
- Aufbauend auf die implementierte Software-Bibliothek LibRoILoD sind verschiedene Client-Server-Applikationen zur bedarfsgesteuerten Bildübertragung entworfen und realisiert worden. Die Benutzerrollen Bildautor und Bildbetrachter in Online-Diensten können auf der Basis von LibRoILoD mit einem Autoren- und einem Betrachtungswerkzeug unterstützt werden. Während ersteres vielfältige Einstellmöglichkeiten zur Aufbereitung von Bildern im Vorfeld der Übertragung bietet, unterstützt letzteres mit einer minimalistischen, schnell zu bedienenden Benutzungsschnittstelle die Signalisierung eines geänderten Bedarfs während laufender Übertragung.
- Es wurde die Fokus-und-Kontext-Technik Rechteckiger FishEye-View zur kombinierten Übertragung und Anzeige großer Bilder entwickelt, die Bildschirmfläche und Netzbandbreite effizient ausnutzt. Ein interessierender Bildausschnitt, der Fokus, wird in Originalgröße dargestellt und ist von Kontextringen umgeben, deren Platzbedarf durch verzerrte Darstellung verringert wird. Die Flexibilität des neu entwickelten XY-unabhängigen Dekompositionsschemas ermöglicht es, nur die Daten zu übertragen, die für die Darstellung benötigt werden. Somit führt die Einsparung von Bildschirmfläche auch zur Einsparung von Bandbreite.
- Die entwickelte waveletbasierte Bildübertragung ist für Farbtabellenbilder ineffizient. Bilder dieser Klasse werden heute meist in den Bilddateiformaten interlaced GIF und interlaced PNG übertragen. Diese etablierten Formate gestatten eine progressive Verfeinerung der Auflösung. Das erfordert die Übertragung eines großen Teils der Datenmenge, bevor feine Details im Bild erkennbar sind. Für die in Online-Diensten häufig zur Navigation eingesetzten grafischen Menüs bedingt dies in mobilen Umgebungen eine lange Übertragungszeit und damit lange Wartezeiten für den Nutzer, bevor die Navigationsmenüs benutzbar sind.
- Es wurde das neue Kodierungsverfahren MoviColorQ für Farbtabellenbilder entwickelt, das durch eine Verfeinerung der Farbtiefe diesen Nachteil nicht aufweist. Feine Details mit hohem Kontrast sind früh im Verlauf der Übertragung erkennbar, so dass eine Verkürzung der Wartezeit erzielbar ist. Dabei sind die erreichbaren Kompressionsraten für Farbtabellenbilder denen der Standardverfahren interlaced PNG und GIF überlegen bzw. gleichwertig.
- In dieser Arbeit wurden generelle Lösungen zur Übertragung von Rasterbildern mit Regions of Interest und Levels of Detail in mobilen Umgebungen entwickelt. Speziell wurde Wert auf die Einsparung von Übertragungsbandbreite bei der Bildübertragung und von Bildschirmfläche bei der Präsentation der übertragenen Bilder gelegt. Das entwickelte formale Modell ist auf verschiedene Bildkodierungsverfahren anwendbar. Neben der vorgestellten eigenen Umsetzung für waveletkodierte Bilder ist beispielsweise auch eine Realisierung auf der Basis des neuen Bildkodierungsstandards JPEG2000 möglich.
Bibliothek
Universität Rostock, Universitätsbibliothek,
Informationsvermittlungsstelle
Postfach
D-18051 Rostock
http://www.uni-rostock.de/ub/