Gastvortrag: Optische Bilderkennung von Notendrucken

27.05.2021 18:30

Optische Bilderkennung von Notendrucken der weißen Mensuralnotation mittels Verfahren der künstlichen Intelligenz

27. Mai – 18:30 Uhr – digital

Martin L. Fiala (Landesmusikschule Steyr), Olaf Nowitzki, Corinna Engelhardt-Nowitzki und Wilfried Wöber (alle Fachhochschule Technikum Wien)

Die Konvertierung gedruckter weißer Mensuralnoten in digitale moderne Notationsformate ist ein aufwendiger Vorgang: Der Musikhistoriker muss Musikstücke Symbol für Symbol manuell transkribieren. In diesem Vortrag wird daher ein Algorithmus vorgestellt, der unter Verwendung von Verfahren der künstlichen Intelligenz gescannte oder fotografierte Musiknotenblätter dieser historischen Epoche (16. und 17. Jahrhundert) automatisiert in ein Dateiformat umwandelt, das in aktueller Notationssoftware lesbar ist. Dies beinhaltet die optische Erkennung der verwendeten musikalischen Symbole und deren semantische Interpretation, d.h. insbesondere die Bestimmung der Tonhöhe basierend auf den Schlüssel- oder Vorzeicheninformationen. Aufgrund der exemplarischen Verwendung eines Musikstücks, das bereits übertragen in die moderne Notation vorliegt, ist die Genauigkeit des Verfahrens einfach überprüfbar.

Der Algorithmus beruht auf der Kombination mehrerer tiefer neuronaler Netzwerke (convolutional neural networks), ergänzt um zusätzliche Algorithmen zur Abbildung historischer und moderner Notensatzregeln. Methodisch ist dieses Verfahren zur optischen Musikerkennung (optical music recognition, OMR) in vier Schritte gegliedert. Der letzte Schritt überführt das konvertierte Notenmaterial in das gängige Austauschformat MusicXML. Die Erkennungsrate liegt für das hier verwendete Musikmaterial im Bereich von ~99% (mit Ausnahme seltener Symbole). Angesichts der vielversprechenden Ergebnisse sowie vergleichbarer Befunde aus einem früheren Untersuchungsfall mit anderem Notenmaterial schlagen wir vor, künftige Forschungsarbeiten auf andere Materialien, Epochen, Notensymbole und fortgeschrittenere semantische Analysen auszuweiten.

Der Vortrag über Zoom ist unter folgendem Link zugänglich:
https://univienna.zoom.us/j/98942011836?pwd=S01kV0JYL0dMUjJyaUtwamdKSlo5UT09 

Meeting-ID: 989 4201 1836
Kenncode: 099890