Mein Programmier-Projekt: Stimmenimitator
Zeitraum: 2010 bis 2017
Status: Online, Entwicklung vorläufig abgeschlossen
Website: https://www.louis-coder.com/VoiceImitator/index.html
Download: https://www.louis-coder.com/VoiceImitator/Barack_Installer.exe
(Eventuell müssen Sie das .NET Framework 3.5 installieren, bitte folgen Sie dem Link auf der Website)
Eingesetzte Techniken: Visual Studio 2005, Visual C++ .NET, Win32 API (v. a. die winmm Audio-Schnittstelle), Schnelle Fourier-Transformation (“FFT”), .wav Dateien Lesen/Schreiben, eigene DLL Erstellen und Einbinden (“__declspec(dllexport/import)”), Bandicam + Windows Movie Maker (Demo-Video, s. u.)
Alle “Stimmenimitator” Varianten erlauben es dem Nutzer, in sein Mikrofon zu sprechen, und seine Worte in der Stimme der zu imitierenden Person zu hören. Die Prosodie der Nutzerstimme wird weitestgehend mit imitiert, das ist der Unterschied zur Text-to-Speech Technik. Momentan sind auf meiner Webseite 5 Stimmen verfügbar. Der Imitations-Code ist übrigens nicht von irgendwo her kopiert worden, sondern ich habe ihn komplett selbst entwickelt. Kernidee ist grob gesagt die Zerlegung von Stimmdaten mittels FFT in Frequenz-Spektren und Vergleich der Spektren untereinander. Die Teile der zu imitierenden Stimme, die der Benutzerstimme am nähsten kommen, werden konkateniert, nachbearbeitet und ergeben das Endresultat.
Demo Video: der von mir ins Mikrofon gesprochene Text wird mit der Stimme von Barack Obama wiedergegeben
Sehen Sie als nächstes: Mein Programmier-Projekt: Polynomial 3-SAT Solver