VatisTech

Vatis Tech

Infraestrutura de reconhecimento de voz para todos

Tecnologia de reconhecimento de voz precisa, económica e acessível.

Existem duas formas de o fazer: manualmente ou recorrendo a grandes empresas tecnológicas.
Uma pessoa leva, em média, cerca de 5 horas (e um perito, 3 horas) a transcrever manualmente conteúdos de áudio ou vídeo, para obter uma precisão de 95% a custos elevadíssimos.
Se usa uma solução de conversão de voz em texto de uma grande empresa, obtém a transcrição em metade do tempo do conteúdo de vídeo ou áudio; ou seja, para um conteúdo de uma hora, obtém a transcrição em 30 minutos. Este processo é rápido, mas perde-se em precisão, que passa a ser de 80%. Além disso, as atualizações das grandes empresas são raras.