Prática de pronúncia

Ainda há pouco tempo era o professor o único modelo da pronúncia correta de uma língua. A pronúncia correta dos falantes nativos podia substituir-se pelas gravações, mas sempre faltava a reação.

Um autodidata que ainda não sabe bem pronunciar as palavras pode receber a reação desejada utilizando a função de reconhecimento da fala com a visualização dos sonidos e a marcação dos limites dos fonemas. Como modelo serve a gravação da voz de um falante nativo. Ésta não é apenas reproduzida, mas está visualizada em forma de um diagrama onde o cursor marca o momento atual da gravação. Um diagrama parecido gera-se também da gravação da voz do estudante o que facilita a comparação das formas de pronúncia e a pesquisa dos desvios. O diagrama possibilita observar as diferenças entre as partes que o estudante antes considerava como parecidas e assim pode reparar nas diferenças entre a pronúncia-modelo e a pronúncia dele.

Parte linguística

A tecnologia baseia-se no reconhecedor de fala que tenta interpretar o som segundo dada transcrição. Procura as partes semelhantes aos fonemas da transcrição e marca os seus limites.

Soluções de software

Desde o ponto de vista do hardware, o reconhecedor é a parte tecnológica mais exigente, geralmente ativa-se desde os servidores dedicados. Na aplicação integra-se a visualização do diagrama marcando os limites dos fonemas e a animação da reprodução e a comunicação com o servidor de reconhecimento da fala.

Funções acessíveis

Servidor de reconhecimento da fala

introduz-se o som e sua transcrição e o servidor encontra as posições dos limites de diferentes formas.

Parte de aplicação

envio do sonido e a transcrição ao servidor.
visualiza o diagrama das magnitudes do sonido marcando os intervalos de diferentes fonemas.
anima o cursor do diagrama durante a reprodução do sonido.

Sistemas operativos

A implementação da parte de aplicação é acessíveis para os sistemas de Windows, Linux, iOS e Android. O reconhecedor é acessível para Linux.