POPULARITY
Ein ganz besonderer und sehr wichtiger Vektor bei Ebenen ist der Normalenvektor. Um den wirst du beim Rechnen mit Ebenen nicht drumrum kommen. Deshalb gibt's in dieser Folge kurz und knapp alles zum Normalenvektor. Der Podcast soll in Zusammenarbeit mit DIR entstehen. Also lass mir sehr gerne deine Anregungen, Wünsche, Ideen, Fragen da. Das kannst du auf meiner Website www.catchthenumbers.de oder bei Instagram @catchthenumbers machen. Auf meiner Website findest du außerdem mein Coaching-Programm. Make Yourself proud! Deine Nadine :)
Im Gespräch mit Daniel Koester am Computer Vision for Human-Computer Interaction Lab (cv:hci) geht es um die Erkennung des freien Weges vor unseren Füßen. Das cv:hci befasst sich mit der Fragestellung, wie Menschen mit Computer oder Robotern interagieren, und wie gerade die Bildverarbeitung dazu beitragen kann. Das Thema lässt sich auch gut mit dem Begriff der Anthropromatik beschreiben, der von Karlsruher Informatikprofessoren als Wissenschaft der Symbiose von Mensch und Maschine geprägt wurde und im Institut für Anthropromatik und Robotik am Karlsruher Institut für Technologie (KIT) http://www.kit.edu/ erforscht und gelebt wird. So wurde der ARMAR Roboter, der elektronische Küchenjunge (Video), ebenfalls am Institut an der Fakultät für Informatik entwickelt. Schon früh stellte sich heraus, dass die Steuerung von Programmierung von Computern mit höheren Programmiersprachen wie Fortran, BASIC oder Logo durch Anlehnung an die menschliche Sprache große Vorteile gegenüber der Verwendung der Maschinensprache besitzt. Damit liegt das Thema ganz natürlich im Bereich der Informatik ist aber auch gleichzeitig sehr interdisziplinär aufgestellt: Das Team des KaMaRo (Folge im Modellansatz Podcast zum KaMaRo und Probabilistischer Robotik) entwickelt den Roboter in einem Team aus den Disziplinen Maschinenbau, Elektrotechnik und Informatik. Mit der Freiflächenerkennung befasst sich Daniel Koester seit seiner Diplomarbeit, wo er die Frage anging, wie die Kurzstreckennavigation für blinde Personen erleichtert werden kann. Hier besteht eine Herausforderung darin, dass zwischen einer Fußgängernavigation und der Umgebungserfassung mit dem Blindenlangstock eine große informative Lücke besteht. Nach Abschaltung der Selective Availability des GPS liegt die erreichbare Genauigkeit bei mehreren Metern, aber selbst das ist nicht immer ausreichend. Dazu sind Hindernisse und Gefahren, wie Baustellen oder Personen auf dem Weg, natürlich in keiner Karte verzeichnet. Dabei können Informationen von anderen Verkehrsteilnehmern Navigationslösungen deutlich verbessern, wie das Navigationssystem Waze demonstriert. Die Erkennung von freien Flächen ist außer zur Unterstützung in der Fußgängernavigation auch für einige weitere Anwendungen sehr wichtig- so werden diese Techniken auch für Fahrassistenzsysteme in Autos und für die Bewegungssteuerung von Robotern genutzt. Dabei kommen neben der visuellen Erfassung der Umgebung wie bei Mobileye auch weitere Sensoren hinzu: Mit Lidar werden mit Lasern sehr schnell und genau Abstände vermessen, Beispiele sind hier das Google Driverless Car oder auch der KaMaRo. Mit Schall arbeiten Sonor-Systeme sehr robust und sind im Vergleich zu Lidar relativ preisgünstig und werden oft für Einparkhilfe verwendet. Der UltraCane ist beispielsweise ein Blindenstock mit Ultraschallunterstützung und der GuideCane leitet mit Rädern aktiv um Hindernisse herum. Mit Radar werden im Auto beispielsweise Abstandsregelungen und Notbremsassistenten umgesetzt. Die hier betrachtete Freiflächenerkennung soll aber keinesfalls den Langstock ersetzen, sondern das bewährte System möglichst hilfreich ergänzen. Dabei war es ein besonderer Schritt von der Erkennung bekannter und zu erlernenden Objekte abzusehen, sondern für eine größere Robustheit und Stabilität gerade die Abwesenheit von Objekten zu betrachten. Dazu beschränken sich die Arbeiten zunächst auf optische Sensoren, wobei Daniel Koester sich auf die Erfassung mit Stereo-Kamerasystemen konzentriert. Grundsätzlich ermöglicht die Analyse der Parataxe eine dreidimensionale Erfassung der Umgebung- dies ist zwar in gewissem Maße auch mit nur einer Kamera möglicht, die sich bewegt, jedoch mit zwei Kameras in definiertem Abstand wird dies deutlich leichter und genauer. Dies entspricht dem verbreiteten stereoskopischen Sehen von Menschen mit Augenlicht, doch mitunter kommt es zu Situationen, dass Kinder bei einem schwächeren Auge das stereoskopische Sehen nicht erlernen- hier können temporär Augenpflaster zum Einsatz kommen. Zur Rekonstruktion der Tiefenkarte aus einem Stereobild müssen zunächst korrespondierende Bildelemente gefunden werden, deren Parallaxenverschiebung dann die Bildtiefe ergibt. Ein Verfahren dazu ist das Block-Matching auf Epipolarlinien. Für ein gutes Ergebnis sollten die beiden Sensoren der Stereo-Kamera gut kalibriert und die Aufnahmen vor der Analyse rektifiziert sein. Die Zuordnung gleicher Bildelemente kann auch als lokale Kreuzkorrelation gesehen werden. Diese Tiefenrekonstruktion ist auch den menschlichen Augen nachempfunden, denen durch geeignete Wiederholung zufälliger Punkte in einem Bild eine räumliche Szene vorgespielt werden kann. Dieses Prinzip wird beim Stereogrammen oder Single Image Random Dot Stereogram (SIRDS) ausgenutzt. Weiterhin muss man die Abbildungseigenschaften der Kameras berücksichtigen, damit die Parallaxverschiebungen auf horizontalen Linien bleiben. Ebenso müssen Vignettierungen ausgeglichen werden. Algorithmen, die nur lokale Informationen zur Identifikation von Korrespondenzen verwenden, lassen sich sehr gut parallelisieren und damit auf geeigneter Software beschleunigen. Für größere gleichmäßige Flächen kommen diese Verfahren aber an die Grenzen und müssen durch globale Verfahren ergänzt oder korrigiert werden. Dabei leiden Computer und Algorithmen in gewisser Weise auch an der Menge der Daten: Der Mensch ist ausgezeichnet darin, die Bildinformationen auf das eigentlich Wichtige zu reduzieren, der Computer hat damit aber große Schwierigkeiten. Für den Flowerbox-Testdatensatz (2GB) wurden Videos mit 1600x1200 Pixeln aufgelöste und synchronisierte Kameras in Stereo aufgezeichnet. Beispiele für synchronisierte Stereokamera-Systeme im Consumer-Bereich sind die Bumblebee oder das GoPro 3D-System. Die Kameras wurden leicht nach unten gerichtet an den Oberkörper gehalten und damit Aufnahmen gemacht, die dann zur Berechnung des Disparitätenbildes bzw. der Tiefenkarte verwendet wurden. Ebenso wurden die Videos manuell zu jedem 5. Bild gelabeled, um die tatsächliche Freifläche zur Evaluation als Referenz zu haben. Der Datensatz zeigt das grundsätzliche Problem bei der Aufnahme mit einer Kamera am Körper: Die Bewegung des Menschen lässt die Ausrichtung der Kamera stark variieren, wodurch herkömmliche Verfahren leicht an ihre Grenzen stoßen. Das entwickelte Verfahren bestimmt nun an Hand der Disparitätenkarte die Normalenvektoren für die Bereiche vor der Person. Hier wird ausgenutzt, dass bei der Betrachtung der Disparitätenkarte von unten nach oben auf freien Flächen die Entfernung kontinuierlich zunimmt. Deshalb kann man aus der Steigung bzw. dem Gradienten das Maß der Entfernungszunahme berechnen und damit die Ausrichtung und den auf der Fläche senkrecht stehenden Normalenvektor bestimmen. Die bestimmte Freifläche ist nun der zusammenhängende Bereich, bei denen der Normalenvektor ebenso aufrecht steht, wie bei dem Bereich vor den Füßen. Die Evaluation des Verfahrens erfolgte nun im Vergleich zu den gelabelten Daten aus dem Flowerbox-Datensatz. Dies führt auf eine Vierfeld-Statistik für das Verfahren. Im Ergebnis ergab sich eine korrekte Klassifikation für über 90% der Pixel auf Basis der realistischen Bilddaten. Die veröffentlichte Software ist im Blind and Vision Support System (BVS) integriert, in der erforderliche Module in der Form eine Graphen mit einander verknüpft werden können- bei Bedarf auch parallel. Eine ähnliche aber gleichzeitig deutlich umfassendere Architektur ist das Robot Operation System (ROS), das noch viele weitere Aspekte der Robotersteuerung abdeckt. Eine wichtige Bibliothek, die auch stark verwendet wurde, ist OpenCV, mit der viele Aspekte der Bildverarbeitung sehr effizient umgesetzt werden kann. Die Entwicklung der Hardware, gerade bei Mobilgeräten, lässt hoffen, dass die entwickelten Verfahren sehr bald in Echtzeit durchgeführt werden können: So können aktuelle Smartphones Spiele Software des Amiga Heimcomputers in einem interpretierten Javascript Emulator auf der Amiga Software Library auf Archive.org nahezu in Orginalgeschwindigkeit darstellen. Für die Umsetzung von Assistenzsystemen für blinde und sehgeschädigte Menschen ist aber auch immer der Austausch mit Nutzern erforderlich: So sind Freiflächen für sich für blinde Personen zunächst Bereiche ohne Orientierbarkeit, da es keinen tastbaren Anknüpfungspunkt gibt. Hier müssen entweder digitale Linien erschaffen werden, oder die Navigation sich weiter nahe an fühlbaren Hindernissen orientieren. Am cv:hci ist der Austausch durch das angeschlossene Studienzentrum für sehgeschädigte Studierende (SZS) unmittelbar gegeben, wo entwickelte Technik sich unmittelbar dem Alltagsnutzen stellen muss. Die entwickelte Freiflächenerkennung war nicht nur wissenschaftlich erfolgreich, sondern gewann auch einen Google Faculty Research Award und die Arbeitsgruppe wurde in der Lehre für ihr Praktikum den Best Praktikum Award 2015 ausgezeichnet.Literatur und weiterführende Informationen D.Koester: A Guidance and Obstacle Evasion Software Framework for Visually Impaired People, Diplomarbeit an der Fakultät für Informatik, Karlsruher Institut für Technologie (KIT), 2013.D. Koester, B. Schauerte, R. Stiefelhagen: Accessible Section Detection for Visual Guidance, IEEE International Conference on Multimedia and Expo Workshops (ICMEW), 2013.
In vielen Spielen steckt Mathematik, seien es Minecraft, Wasserraketen oder Tiptoi. Lisa Mirlina und Felix Dehnen haben sich Qwirkle (ein Spiel der Schmidt Spiele von Susan McKinley Ross) einmal ganz genau angesehen. Die beiden konnten als Teilnehmer des Hector-Seminar an einem Kooperationsprojekt mit der Fakultät für Mathematik am Karlsruher Institut für Technologie (KIT) teilnehmen. Hier betreute sie Prof. Dr. Frank Herrlich in dem Projekt auf der Suche nach der perfekten Qwirkle-Lösung- wofür die beiden ihm ganz herzlich danken. Das Legespiel war 2011 Spiel des Jahres und besteht aus 108 Spielsteinen aus sechs verschiedenen Farben und sechs verschiedenen Formen- jede Kombination kommt dabei dreimal vor. Jeder Spielteilnehmer versucht aus seinen eigenen sechs nachzuziehenden Spielsteinen gleiche Formen oder gleiche Farben auf dem Tisch in Reihen zusammenzulegen. Wie bei Scrabble gibt es für jedes Anlegen Punkte- es müssen aber alle entstehende Reihen korrekt sein- von Farbe oder Form, wie bei Mau-Mau oder Domino. Das Spielziel ist eine möglichst hohe Anzahl von Punkten zu erreichen. Den mathematischen Hintergrund zum Spiel fanden die beiden in der Topologie: Auf einem Tisch kann man höchstens 36 Steine perfekt anordnen- auf einer anderen topologischen Struktur eventuell mehr. Mit Hilfe von Verklebungen kann man zu Flächen wie beispielsweise auf einem Torus gelangen- wenn man die jeweils die gegenüberliegenden Seiten miteinander verklebt: Auf einem Torus haben wirklich alle Steine vier Nachbarn- und nicht nur die Steine im Inneren. Die Frage ist nun, ob es möglich ist, eine Fläche zu finden, wo jeder der 108 Steine in genau zwei perfekten Qwirkle-Reihen- also jeder Form oder Farbe- liegen kann. Neben einem Torus kann man durch Verkleben aus einem Quadrat oder Rechteck auch die Sphäre, das Möbiusband, die Projektive Ebene oder die Kleinsche Flasche erzeugen. Dabei sind das Möbiusband, die projektive Ebene und die Kleinsche Flasche nicht mehr orientierbar, da man keinen Normalenvektor angeben kann. Die projektive Fläche hat in ihrer Darstellung durch homogene Koordinaten eine wichtige Anwendung in der Computergrafik, da Verschiebungen auch als lineare Abbildungen umgesetzt werden können und die gesamte Berechnung deutlich erleichtert. Auch frühere Folgen zu Teichmüllerkurven (Modell042) und wilden Singularitäten (Modell060) haben im Modellansatz Podcast Topologie und Verklebungen behandelt. Die Topologie ist dabei überhaupt nicht so theoretisch, wie sie zunächst erscheint- denn da wir nicht auf einer Ebene oder flachen Erde leben, können wir einmal um die Erde herumgehen, und nach langem Weg wieder an dem gleichen Ort wieder ankommen. Wir können auch andere Winkelsummen von Dreiecken bestimmen. Diese Experimente können wir beim Universum leider nicht leicht durchführen, und so ist die Forschung nach der Topologie des Universums sehr aktuell. In der Topologie können Flächen bzw. zwei topologische Räume als äquivalent angesehen werden, wenn sie durch eine Homöomorphie, also durch eine stetige und stetig umkehrbare Abbildung in einander überführt werden können. So ist eine Tasse (mit einem Henkel) zu einem Torus homöomorph- nicht jedoch zu einem Becher ohne Henkel. Dies führt auf das interessante Gebiet der topologischen Klassifikation der Flächen, denn man kann durch eine genügend feine Unterteilung der Fläche in beispielsweise Dreiecke, einer Triangulierung, zusammen mit einigen Regeln die Art der Fläche bestimmen. Dies führt auf den verallgemeinerten Satz von Euler für orientierbare Flächen, wo die Zahl der Ecken, die Zahl der Flächen, die Zahl der Kanten und das Geschlecht bezeichnet: Das Drei Häuser-Problem ist ein Knobelrätsel zu diesem Satz, da das Problem auf einer Ebene oder eine Sphäre nicht lösbar ist, jedoch auf dem Torus eine Lösung besitzt. Für das Qwirkle-Spiel liefert der Dreifach-Torus (oder eine Brezel) eine Lösung für 8 Steine, wo jeweils zwei Steine doppelt sind und daher auf einem Tisch nicht so anzuordnen wären: Für 18 Steine haben sie eine unsymmetrische Lösung gefunden, die sich nicht so leicht auf mehr Steine erweitern ließ: Mit der Treppenstruktur wie bei 8 Steinen mit einer 9er Struktur kann man aber eine Lösung aus 108 Steinen konstruieren: Nach dem Satz von Euler ist diese Lösung auf einer Fläche, die einem Fünf-Torus entspricht- oder einer Brezel mit zwei Löchern zu viel. Dies ist aber nicht die einzige Lösung für 108 Steine- mit Gruppentheorie kann man nach weiteren Lösungen suchen: Denn so, wie die Steine sich nach Verklebung in einer Richtung wiederholen, so können auch Gruppen genau diese Wiederholungen darstellen. Ein sehr einfaches Beispiel ist die zyklische Gruppe aus drei Elementen 0, 1, 2, die man mit der Addition verknüpft, und bei Ergebnissen über 2 wieder drei abzieht, wie man in dieser Verknüpfungstafel ablesen kann: +012001211202201Auf drei Elementen kann man aber auch die Symmetrische oder Permutations-Gruppe definieren: In dieser sind alle möglichen sechs Vertauschungen bzw. Permutationen von den drei Elementen enthalten. Ein anderer Ansatz ist es, die drei Elemente als Ecken eines gleichseitigen Dreiecks zu sehen und alle Rotationen oder Spiegelungen zur Dieder- oder Symmetriegruppe definieren. Im speziellen Fall von drei Elementen stimmen die beiden Gruppen mit je sechs Abbildungen überein, d.h. : Durch das direkte Produkt von drei Symmetriegruppen erhält man eine Gruppe mit 216 Elementen, unter Festhalten des Signums (bzw. Vorzeichen), kann man durch Faktorisierung eine Untergruppe mit 108 Elementen bestimmen- die Qwirkle-Gruppe. Aus dieser Gruppe kann man nun wieder eine Fläche erzeugen, die das perfekte Qwirkle-Spiel mit 108 Steinen mit vollkommen symmetrischen Aufbau ermöglicht: Die Fläche dieser Lösung hat das Geschlecht 37, ist also äquivalent zu einer Tasse mit 37 Henkeln. Mit diesem Projekt starteten Lisa Mirlina und Felix Dehnen bei Jugend forscht- zunächst beim Regionalentscheid, dann beim Landesentscheid und schließlich dem Bundeswettbewerb. Sie gewannen den Preis der Deutschen Mathematiker-Vereinigung (DMV) für besonders kreativen Einsatz der Mathematik. Und dann ging es als Delegation nach Japan. Literatur und Zusatzinformationen L. Mirlina, F. Dehnen: Qwirkle, Abschlussbericht im Hector-Seminar, 2014. J. Stillwell: Classical topology and combinatorial group theory, Vol. 72. Springer Science & Business Media, 2012. W. Lück: Topologie, Gespräch mit G. Thäter im Modellansatz Podcast, Folge 40, Fakultät für Mathematik, Karlsruher Institut für Technologie (KIT), 2014.