Automatisierte Erkennung von Vogelstimmen mittels neuronaler Netze

(26.02.2018) TU-Chemnitz-Doktorand Stefan Kahl forscht in ESF-gefördertem Projekt zur automatisierten Erkennung von Vogelstimmen mittels neuronaler Netze – Kooperation mit US-Universität

Um wildlebende Tierarten wie Vögel nachhaltig schützen zu können, ist eine stetige Kontrolle und Überwachung unabdingbar. Wildtiere lassen sich aber nur eingeschränkt in freier Wildbahn dauerhaft durch den Menschen beobachten.

In aller Regel werden daher Bild- und Tonrekorder eingesetzt, die Langzeitdaten aufzeichnen. Fluch und Segen zugleich: Denn die dabei anfallenden Datenmengen müssen zuerst ausgewertet werden, bevor sie nutzbar sind.


In seinem ESF-geförderten Projekt möchte TU-Forscher Stefan Kahl eine Automatisierung in der Erkennung von Vogelstimmen erreichen.

Dieser Herausforderung stellt sich Stefan Kahl, Promovend der Stiftungsjuniorprofessur Media Computing an der Fakultät für Informatik der Technischen Universität Chemnitz.

Spezialisiert auf Vögel hat er sich der Frage angenommen, wie man die verschiedenen Arten anhand ihrer Vokalisation, also ihrer Stimmen, in Audio-Aufnahmen automatisiert erkennen kann. Der Europäische Sozialfond (ESF) fördert das Projekt über einen Zeitraum von drei Jahren mit insgesamt 57.600 Euro.

Einsatz von künstlichen neuronalen Netzen zur Audioverarbeitung

Kahls Promotions-Thema entsprang einer im Jahr 2016 gestarteten Kooperation zwischen der Juniorprofessur Media Computing (Dr. Danny Kowerko) und der Professur Medieninformatik der TU Chemnitz mit dem „Bioacustic Research Program“ am Cornell Lab of Ornithology (Cornell University in Ithaca/New York), geleitet von Prof. Dr. Holger Klinck.

Die TU-Professuren und die wissenschaftliche Non-profit-Organisation wollen vor allem die Arbeit von Ornithologen und Vogel-Enthusiasten erleichtern. Stefan Kahl entwickelt deshalb eine Software, die Audio-Daten auswertet und automatisch Vogelarten erkennen und klassifizieren kann.

Dabei stößt der Medieninformatiker aber auch auf einige Herausforderungen: „Die Verarbeitung von Audio-Rohdaten ist aufgrund der Länge der Signale nicht einfach für die Detektion und Klassifikation von akustischen Events geeignet. Es muss daher eine Repräsentation gefunden werden, die die Signale vereinfacht“, erläutert Kahl.

Der TU-Forscher selbst ist spezialisiert auf den Bereich Bildverarbeitung und macht sich dieses Wissen für die Verarbeitung der Audio-Daten zunutze. „Die entwickelte Software ist darauf geeicht, die Audiosignale in Bilder zu konvertieren, in so genannte Spektrogramme. Diese bildhaften Repräsentationen der Audiosignale haben sich als besonders geeignet für die Detektion und Klassifikation von akustischen Events herausgestellt“, erklärt Kahl.

Die in Spektrogramme umgewandelten Tonaufnahmen nimmt Kahl, um damit ein künstliches neuronales Netz zu trainieren, welches möglichst gut auf Vogelgesang angepasst ist.

„Künstliche neuronale Netze haben in den vergangen Jahren extreme Fortschritte im Bereich der Objekterkennung und -klassifikation gemacht. Aktuelle Forschungsergebnisse, die diese Methode als sehr effektiv ausweisen, stützen mein Vorgehen“, sagt der TU-Promovend. Allerdings benötigt das künstliche neuronale Netz spezielle Prozessoren, wie sie vor allem auf leistungsstarken (und damit kostspieligen) Grafikkarten zu finden sind.

Allein deshalb hat die Professur Medieninformatik 2017 spezialisierte Hardware im Wert von circa 30.000 Euro beschafft.

Erkennung von Vögeln als Basis für weitere Tierarten – Unterstützung durch US-Institut

Ein Vorteil für Kahls Forschungsarbeit: Die Gemeinschaft der Vogel-Enthusiasten ist sehr groß und engagiert, wenn es darum geht, die Geräusche der Tiere mit gerichteten Mikrofonen aufzunehmen und die Audio-Dateien zur Verfügung zu stellen.

„Die Arbeit mit der Vokalisation von Vögeln gibt einen sehr guten Startpunkt für die automatisierte Detektion und Klassifikation akustischer Events. Es ist außerdem weniger kompliziert, man kann quasi im eigenen Garten tätig werden“, erklärt Stefan Kahl und betont: „Ohne die Aufnahmen der, mitunter schon semi-professionell agierenden, Vogel-Freunde wäre das Vorhaben kaum zu realisieren.“

Viel Unterstützung erhält das Projekt auch vom Cornell Lab of Ornithology. Der Kooperationspartner liefert stetig Zuarbeiten durch sogenannte „Annotationen“, eine Möglichkeit zur teilautomatisierten Programmierung, sowie durch Tonaufnahmen (Soundscapes) und hochwertige Archiv-Aufnahmen. Damit werden Sets von Trainingsdaten erstellt.

Es handelt sich hierbei um Aufnahmen aus ungerichteten Mikrofonen, die zum Beispiel auf dem Gelände des Cornell Lab in großer Stückzahl eingesetzt werden und 24 Stunden am Tag aufzeichnen. Hilfe erhält Kahl außerdem von Forschenden der New York University, in dem sie Zugriff auf die Code-Basis eines ähnlichen Projektes bieten.

Mobile Nutzung für jeden möglich machen

„Seit der Teilnahme am international renommierten wissenschaftlichen Wettbewerb ‚ImageCLEF 2017‘ konnten die Verfahren noch einmal deutlich verbessert werden. Inzwischen ist zum Beispiel die Erkennung von Nord-Amerikanischen Vogelarten mit einer Genauigkeit von 85% in monophonen Aufnahmen möglich“, äußert sich Kahl zum aktuellen Stand.

Die Forschungsgruppe um den TU-Mitarbeiter erreichte damals Platz zwei im ImageCLEF-Wettbewerb. Mittlerweile kann die Auswertung von mehreren 10.000 Soundscapes automatisiert erfolgen.

Ein weiteres großes Ziel des Forschungsprojektes ist außerdem die Erkennung und Klassifikation der Vogelarten in Echtzeit direkt durch den Rekorder. Ein äußerst schwieriges Unterfangen – muss das Gerät doch mit leistungsstarker Hardware ausgestattet sein.

Immerhin: Erste prototypische Tests mit mobilen Rekordern wurden bereits erfolgreich durchgeführt. Außerdem befindet sich eine Android-App in Entwicklung, mit der es für jeden möglich sein soll, Vögel in freier Wildbahn zu beobachten und anhand ihres Gesangs oder ihrer Rufe zu identifizieren.



Weitere Meldungen

Prachtstaffelschwanz-Weibchen im Nest; Bildquelle: Ashton Claridge, Sonia Kleindorfer

Das Schlaflied der Vogelmutter spielt eine größere Rolle als bisher angenommen

Eine neue Studie unter der Leitung der Biologin Sonia Kleindorfer von der Universität Wien untersucht die vorgeburtliche Klangerfahrung und Klanglehre junger Singvögel
Weiterlesen

Verkehrslärm beeinträchtigt das Gesangslernen und hemmt darüber hinaus das Immunsystem von jungen Zebrafinken; Bildquelle: Sue Anne Zollinger

Verkehrslärm beeinträchtigt das Gesangslernen von Vögeln

Verkehrslärm führt bei Jungvögeln zu Ungenauigkeiten und Verzögerungen beim Erlernen ihres Gesangs. Die Jungvögel leiden auch unter einem unterdrückten Immunsystem, was ein Indikator für chronischen Stress ist
Weiterlesen

TU-Forscher Dr. Stefan Kahl ist Teil eines internationalen Forschungsteams, das die App 'BirdNET' entwickelt hat.; Bildquelle: Lars Meese/TU Chemnitz

Vogelstimmen-App bereits eine Million Mal weltweit runtergeladen und nun auch auf iOS-Geräten verfügbar

Die von einem Forschungsteam der TU Chemnitz und Cornell University entwickelte KI-gestützte Vogelstimmen-App erkennt bereits mehr als 3.000 Vogelstimmen weltweit und läuft nun auch auf iOS-Geräten
Weiterlesen

Eine Globale Studie von Singvögeln wie diesem Feldschwirl zeigt, dass Frequenzen der Gesänge vor allem von der Körpergröße abhängen.; Bildquelle: Tomáš Albrecht

Globale Studie über Frequenzen von Vogelgesängen

Die Gesangsfrequenz eines Vogels hängt vor allem von seiner Körpergröße ab, wird aber auch von der sexuellen Selektion beeinflusst
Weiterlesen

Junge Zebrafinken imitieren den Gesang eines ausgewachsenen Finken, um später Weibchen anzulocken.; Bildquelle: Richard Hahnloser, ETH/UZH

Wie Zebrafinken ihren Balzgesang lernen

Komplexe Lernprozesse wie Sprechen oder Singen laufen nach ähnlichen Mustern ab
Weiterlesen

Stefan Kahl von der TU Chemnitz entwickelte die App gemeinsam mit Wissenschaftlerinnen und Wissenschaftlern der Hochschule Mittweida und der Cornell University in Ithaca/New York; Bildquelle: Lars Meese

Forscher der TU Chemnitz entwickelten KI-gestützte App zur Vogelstimmen-Erkennung

Die Analyse von Vogelstimmdaten wird für Ornithologinnen, Ornithologen und Hobby-Vogelforscherinnen und –forscher bedeutend einfacher
Weiterlesen

Kolkraben, die an einer Futterstelle auf Probleme stoßen, verwenden eigene Rufe, um weitere Raben herbeizurufen.; Bildquelle: Georgine Szipl

Futter-assoziierte Laute: Was ein "Haa" über eine Futterstelle verrät

Futterrufe von Kolkraben geben Aufschluss über Alter und Geschlecht
Weiterlesen

Japanische Kohlmeisen kommunizieren nach syntaktischen Regeln.; Bildquelle: UZH

Kohlmeisen zwitschern nach sprachähnlichen Regeln

Nicht nur Menschen verbinden Wörter zu Wortgruppen und Sätzen mit spezifischer Bedeutung. Auch Japanische Kohlmeisen kommunizieren nach syntaktischen Regeln, wie Evolutionsbiologen von Tokyo, Uppsala und der Universität Zürich zeigen
Weiterlesen


Wissenschaft


Universitäten


Neuerscheinungen