pte20120809003 Technologie/Digitalisierung, Forschung/Entwicklung

Software findet Städte-Charakteristika in Fotos

Bildanalyse verwendet Aufnahmen aus Street View als Ausgangsmaterial


Paris: Computer erkennt subtilere Charakteristika (Foto: pixelio.de, F. Weyen)
Paris: Computer erkennt subtilere Charakteristika (Foto: pixelio.de, F. Weyen)

Paris/Pittsburgh (pte003/09.08.2012/06:05) Forscher der Carnegie Mellon University http://cmu.edu und der Ecole Normale Superieure Paris http://ens.fr haben eine Software entwickelt, die charakteristische Eigenheiten von Städten auf Grundlage von Fotos finden kann. Bisher hat das Programm 250.000 visuelle Elemente aus 40.000 Street-View-Fotos analysiert und für einige Städte jene Details gefunden, die sowohl häufig als auch unverwechselbar sind, wie EurekAlert berichtet. Für Paris sind das etwa Balkongeländer, Straßenlampen und die Straßenschilder, für New York die berühmten Feuerleitern. Die Ergebnisse werden heute, Donnerstag in Los Angeles präsentiert.

"Für einen Computer sind Bilder nur Pixel. Dass die Forscher es geschafft haben, dass die Maschinen Ergebnisse liefern, die für einen Menschen verständlich sind, ist ein Fortschritt", sagt Thorsten May vom Fraunhofer-Institut für Graphische Datenverarbeitung http://igd.fraunhofer.de gegenüber pressetext.

Enorme Datenmengen

Als Ausgangspunkt dienten den Forschern 25.000 zufällig ausgewählte Bildelemente, die aus Street-View-Aufnahmen von Paris, London, New York, Barcelona und acht anderen Städten generiert wurden. Anschließend analysierte ein Lern-Algorithmus diese Bildausschnitte - wie beispielsweise Fenster oder Straßenschilder - und verglich sie mit ähnlichen Elementen aus den Fotos anderer Städte, um Detail-Unterschiede zu erfassen. "Lernalgorithmen kommen immer dort zum Einsatz, wo Menschen den Überblick verlieren. Bei dieser Zahl von Bildern wäre ein Mensch schlicht überfordert", sagt May.

Nach mehreren Durchläufen erstellt die Software für jede Stadt eine Rangliste der charakteristischen visuellen Elemente. Für San Fransisco etwa sind die Erker das Unterscheidungskriterium Nummer eins. "Das schwierige bei der Analyse ist, dem Computer möglichst genau zu sagen, was im konkreten Fall ein Muster ist. Eine einheitliche Definition gibt es nicht, da für verschiedene Anwendungen unterschiedliche Kriterien gebraucht werden. Die Maschine dazu zu bringen, das zu tun, was ich tun würde, ist die Herausforderung", so May.

Insgesamt sind US-Städte eine größere Herausforderung für den Algorithmus als europäische, da der bunte Stilmix wenig einheitliche Merkmale bietet. Trotzdem vermitteln die vom Computer vorgeschlagenen Fotos ein typischeres Bild der Städte als zufällig ausgesuchte Aufnahmen. Die Analyse ist sehr rechenintensiv. Für die Ergebnisse mussten 150 Prozessoren eine Nacht lang durcharbeiten. "Visuelle Daten sind sehr anspruchsvoll, weshalb die Forschung noch in den Kinderschuhen steckt. Das Potenzial ist enorm. Unsere Software kann Millionen von Bildausschnitten automatisch durchsuchen, etwas das jeden Menschen überfordern würde", sagt Forscher Alexei Efros.

Die von der Software gefundenen Charakteristika können vielfältig eingesetzt werden, etwa zur Analyse der Verbreitung architektonischer Einflüsse in und zwischen Städten oder zur Suche nach Gemeinsamkeiten auf anderen Maßstäben, wie Bezirken oder ganzen Kontinenten. "Langfristig wollen wir einen automatisch erstellten visuellen Atlas erschaffen, der weltweit nicht nur architektonische, sondern auch geologische Eigenheiten für den ganzen Planeten enthält", so Efros. Die Analyse von Bildern hat auch andere handfeste Anwendungen.

"Die Analyse großer Datenmengen ist ein stark anwendungsgetriebenes Gebiet. Die automatische Analyse von Bildern ist auch für den medizinischen Bereich interessant. So können etwa die Schichtbilder aus CT-Scans automatisch den jeweiligen Organen zugeordnet werden", erklärt May. Das noch junge Forschungsgebiet steht derzeit erst am Anfang. "Wir werden mit konkreten Problemen aus verschiedensten Bereichen konfrontiert und machen Konzepte aus der Mathematik für die Praxis zugänglich. In den kommenden Jahren forschen wir daran, den Aufwand, der dafür nötig ist, zu reduzieren", so May.

(Ende)
Aussender: pressetext.redaktion
Ansprechpartner: Markus Keßler
Tel.: +43-1-81140-305
E-Mail: kessler@pressetext.com
Website: www.pressetext.com
|