Justamente o que eu quis dizer: o mecanismo de #TTS (text-to-speech / texto para voz) pode servir para isso mesmo!
Segue exemplo com isto selecionado e compartilhado com #TranslateYou: 猫
Eu não tenho o idioma japonês baixado e configurado aqui, senão ele provavelmente leria "neko" para mim, ao pressionar o botão 🔊