Googles Neuronales Netzwerk für Geo-Tagging von Bildern

Einfaches künstliches Neuronales Netzwerk (Akritasa CC BY-SA 4.0)

Mit einem neu entwickelten Algorithmus zum Geo-Tagging von Bildern, der sich auf ein tief lernendes Neuronales Netzwerk (deep-learning machine) stützt, kann Google fast jedes beliebige Foto nur anhand seiner Pixelinformationen lokalisieren. Und die Ergebnisse sind weit genauer als die, die von Menschen bei der gleichen Aufgabenstellung erzielt werden. Sogar Fotos, die innen aufgenommen wurden, können mit PlaNet lokalisiert werden.

Neuronale Netze – was war das noch gleich?

Neuronale Netzwerke werden seit mehreren Jahrzehnten in der Computertechnologie enwickelt und angewandt. Sie ahmen die Verbindungen zwischen den Neuronen im menschlichen Gehirn nach. Zwischen den Neuronen bestehen Verbindungen, die entweder verstärkend, neutral oder hemmend sein können. Beim Training des Netzwerks, wenn es also „lernt“, werden diese Verbindungen und deren Gewichte verändert. Soviel in aller Kürze zum Grundprinzip – ein tieferer Einstieg in das Thema ist z.B. hier zu finden: www.neuronalesnetz.de. Heute werden Neuronale Netze im Alltag beispielsweise für Spracherkennung genutzt. Am weitesten fortgeschritten ist die Technologie heute aber bei der Verarbeitung von Bilder, unter anderem auch in der Fernerkundung, aber wird eben, wie im fall von PlaNet, auch für andere Zwecke genutzt.

Vorgehensweise von PlaNet

Die Vorgehensweise ist vergleichweise unkompliziert – zumindest im Kontext des komplexen Themas der Neuronalen Netze: Die Erdoberfläche wird in mit einem Raster überzogen, sodass ca. 26.000 Maschen unterschiedlicher Größe entstehen, abhängig von der Anzahl der Zahl der dort aufgenommenen Fotos. Je mehr Fotos, desto feiner das Raster. Ein Bestand von 126 Millionen geo-getaggter Fotos diente zum Training (91 Mio. Bilder) und zur Validierung (34 Mio. Bilder) des Neuronalen Netzwerks, das die Entwickler PlaNet nennen.

Die Zuverlässigkeit wurde weiter anhand von 2,3 Mio. flickr-Bildern getestet und es sind folgende Genauigkeiten in verschiedenen Maßstäben erreicht worden:

  • Straßenzug: 3,6 % Genauigkeit
  • Stadt: 10,1 % Genauigkeit
  • Land: 28,4 % Genauigkeit
  • Kontinent: 48,0 % Genauigkeit

Das mag zunächst nicht sehr beeindruckend klingen, aber im Vergleich mit einer Testgruppe von 10 weitgereisten Leuten schneidet PlaNet bei Weitem besser ab. Das liegt vermutlich daran, dass das Neuronale Netzwerk so viel mehr Orte gesehen hat als auch der weitgereisteste Mensch.

Screenshot GeoGuessr.com
Screenshot GeoGuessr.com

Bei www.geoguessr.com kann man übrigens selbst einmal probieren, wie man sich dabei schlägt.

Fazit

Eine weitere spannende Anwendung von Neuronalen Netzwerken, einer Technologie, die im Hintergrund agiert, aber mittlerweile in unserem Alltag angekommen ist. PlaNet hilft uns demnächst vielleicht beim Geo-Tagging unserer alten Fotosammlung.

Über Hannes Bartl 30 Artikel
Hier schreibt Hannes Bartl über Themen aus der Welt der Geoinformationstechnik. Nach einem Studium der Geografie absolviert er seit 2015 neben seinem Beruf als Berater für Kultur- und Tourismusmarketing ein Studium der Geoinformationssysteme.

Ersten Kommentar schreiben

Antworten

Deine E-Mail-Adresse wird nicht veröffentlicht.


*


*