lordzia это НЕ искусственный интеллект для преобразования речи в текст
обычно нужно наоборот сделать из текста аудиофайл . прочитать и есть несколько синтезаторов с голосом русским
а программа, которая превратит звуковой файл MP3 в текстовый всем нужна ждём но пока это не отдельные проги . обычно это клиент-сервер у гигантов (гугл ,яндекс) с большими серваками например если спросить у яблока какая музыка играет будет отправлена 1 запись с микрофона в планшете на сервак и распознают её там а потом с сервака пришлют результат с ответом и командой запустить прогу и сказать ответ!