
Vatis Tech
Die Spracherkennungsinfrastruktur für alle
Präzise, erschwingliche und für jedermann zugängliche Spracherkennungstechnologie.
Spracherkennung heutzutage ist schlecht und kostet zu viel.
Es gibt zwei Arten der Spracherkennung: manuell oder mithilfe großer Technologieunternehmen.
Die durchschnittliche Person braucht rund 5 Stunden, ein Experte 3 Stunden, um Audio- oder Videoinhalte manuell zu transkribieren, und erreicht dabei unter enormen Kosten eine Genauigkeit von 95 %.
Wenn Sie eine Sprache-zu-Text-Lösung eines großen Technologieunternehmens verwenden, erhalten Sie das Transkript in der Hälfte der Zeit der Länge des Video- oder Audioinhalts; für einen Inhalt mit einer Länge von einer Stunde erhalten Sie das Transkript also in 30 Minuten. Das ist zwar schnell, doch verlieren Sie an Genauigkeit und erhalten nur noch etwa 80 %. Außerdem gibt es von großen Technologieunternehmen nur sehr selten Updates.