Da ich es zuvor versprochen habe, möchte ich hier nun ein Review der TTS-Stimmen des 8110 veröffentlichen:
Die ursprünglich in Version 7.05 mitgelieferte TTS-Stimme "Sabine" wurde von einigen Kunden als zu leise in lärmbelasteten Umgebungen empfunden. Aus diesem Grund hat Navigon das Stimmprofil verändert und subjektiv lauter gemacht. Was dabei genau passiert ist, soll dieser Beitrag zeigen.
Um eine vergleichbare Analyse zu ermöglichen, wurde eine Route in Berlin simuliert, auf der sich verschiedene Ansagen befinden. Diese Simulationen wurden einmal mit der v7.05 und einmal mit der v7.08 Stimme erstellt, die Software in beiden Durchläufen war v7.08.
Das Navigationsgerät wurde auf maximale Lautstärke konfiguriert und über den LineOut-Ausgang an eine Creative SoundBlaster Audigy2 ZS Notebook (PCMCIA) Soundkarte angeschlossen. Die Aufnahme erfolgte dabei linear ohne Equalizing.
Aufgefallen ist, dass das Line-Out Signal des 8110 relativ schwach ist; trotz maximalem Aufnahmepegel an der Audigy wurde lediglich ein Spitzenwert von ca. -15 dB erzielt. Hierbei wurde bemerkt, dass beide Sabinen (was ist eigentlich der Plural von Sabine??) fast identische Ausgangspegel lieferten. Der Verdacht, dass eine der Stimmen also eine geringere Amplitude hätte, konnte sich nicht bestätigen.
Zusätzlich ist aufgefallen, dass es Navigationsanweisungen gibt, die deutlich leiser sind als andere. Dies betrifft beide TTS-Versionen gleichermaßen. Es wurde festgestellt, dass bestimmte Anweisungen fast halbsolaut wiedergegeben werden verglichen mit anderen. Eine Erklärung hierfür konnte nicht gefunden werden.
Bei der anschließenden Analyse der aufgezeichneten Dateien konnte dann der Grund für die subjektiv kräftigere Wiedergabe der Version 7.08 erkannt werden: bei der Stimmerzeugung wurde zusätzlich ein Kompressor eingesetzt, der den Dynamikumfang im Bereich 175 - 500 Hz reduziert und dadurch das Stimmspektrum verändert. Version 7.08 klingt dadurch etwas männlicher und leider auch roboterhafter, da der möglichst natürlich klingenden Konfiguration aus Version 7.05 künstlich entgegengewirkt wurde.
Zur besseren Darstellung wurden die Aufnahmen im Nachhinein auf -1,5 dB normalisiert, dieser Schritt beeinträchtigt die Qualität der Aufnahme jedoch nicht.
Die folgenden Bilder veranschaulichen diesen Sachverhalt: Im oberen Teil des Fensters kann man die Hüllkurve der Wellenform sehen und selbst mit ungeübtem Auge die Unterschiede deutlich erkennen.
Der untere Teil zeigt das Spektrum der ersten Sprachanweisung, auch hier lassen sich die künstlichen Eingriffe auf den Klang deutlich erkennen: Der charakteristische Frequenzverlauf der weiblichen Stimme wurde durch die Dynamikkompression "glattgebügelt".
Sabine v7.05 Analyse
Sabine v7.08 Analyse
Um sich von diesem Ergebnis selbst ein Bild zu machen, seien hier die Audiodateien bereitgestellt, in welchen die Stille zwischen einzelnen Anweisungen herausgeschnitten wurde. Die Dateien sind MP3 komprimiert, somit für weitere Analysen unbrauchbar. Falls jemand die unkomprimierten Originale für eigene Analysen benötigt, kann ich dies gerne zur Verfügung stellen. Die Unterschiede sollten klar hörbar sein. Ebenfalls die Lautstärkeunterschiede einzelner Anweisungen.
Sabine v7.05 Hörprobe
Sabine v7.08 Hörprobe
Fazit: Sabine v7.05 klingt natürlicher, weiblicher und bei weitem sexier. Ich bevorzuge diese Stimme in jedem Fall, gerade wenn man das Audio-Entertainment-System seines Fahrzeugs für die Navigationsausgaben nutzen will.
Sabine v7.08 klingt hingegen kraftvoller und weniger weiblich, dafür kann sich diese Stimme in sehr lauten und brummigen Umgebungen besser gegen den Grundlärm durchsetzen und ist verständlicher.
Hilfreich ist es allemal, beide Stimmen auf seinem Navigationsgerät zu installieren, um so leicht umschalten zu können, je nachdem, was die Situation gerade erfordert. Hierzu kann man eine der Stimmen einfach umbenennen, dann sind sie zusätzlich in der Auswahl verfügbar.
edit: Die Lautstärkeunterschiede sind auf die aktivierte dynamische Lautstärkeanpassung an die Geschwindigkeit zurückzuführen. Aus diesem Grund wurden die Audio-Dateien aktualisiert mit deaktivierter Geschwindigkeitsanpassung, so dass sich nun eine konstante Lautstärke ergibt.
Sämtliche hier verlinkten Dateien sind urheberrechtlich geschützt. Eine Verwendung außerhalb dieses Threads ohne Einverständnis des Urhebers, insbesondere Wiedereinstellen, ist untersagt und wird strafrechtlich verfolgt. Deeplinks auf diese Dateien sind verboten. Stattdessen ist dieser Thread oder der entsprechende Post zu verlinken.