Prática de pronúncia
Ainda há pouco tempo era o professor o único modelo da pronúncia correta de uma língua. A pronúncia correta dos falantes nativos podia substituir-se pelas gravações, mas sempre faltava a reação.
Um autodidata que ainda não sabe bem pronunciar as palavras pode receber a reação desejada utilizando a função de reconhecimento da fala com a visualização dos sonidos e a marcação dos limites dos fonemas. Como modelo serve a gravação da voz de um falante nativo. Ésta não é apenas reproduzida, mas está visualizada em forma de um diagrama onde o cursor marca o momento atual da gravação. Um diagrama parecido gera-se também da gravação da voz do estudante o que facilita a comparação das formas de pronúncia e a pesquisa dos desvios. O diagrama possibilita observar as diferenças entre as partes que o estudante antes considerava como parecidas e assim pode reparar nas diferenças entre a pronúncia-modelo e a pronúncia dele.
Parte linguística
A tecnologia baseia-se no reconhecedor de fala que tenta interpretar o som segundo dada transcrição. Procura as partes semelhantes aos fonemas da transcrição e marca os seus limites.
Soluções de software
Desde o ponto de vista do hardware, o reconhecedor é a parte tecnológica mais exigente, geralmente ativa-se desde os servidores dedicados. Na aplicação integra-se a visualização do diagrama marcando os limites dos fonemas e a animação da reprodução e a comunicação com o servidor de reconhecimento da fala.
Funções acessíveis
Servidor de reconhecimento da fala
- introduz-se o som e sua transcrição e o servidor encontra as posições dos limites de diferentes formas.
Parte de aplicação
- envio do sonido e a transcrição ao servidor.
- visualiza o diagrama das magnitudes do sonido marcando os intervalos de diferentes fonemas.
- anima o cursor do diagrama durante a reprodução do sonido.
Sistemas operativos
A implementação da parte de aplicação é acessíveis para os sistemas de Windows, Linux, iOS e Android. O reconhecedor é acessível para Linux.