VatisTech

Vatis Tech

Infrastruktura rozpoznawania mowy dla wszystkich

Precyzyjna, niedroga i dostępna dla wszystkich technologia rozpoznawania mowy.
Rozpoznawanie mowy stoi na niskim poziomie i kosztuje zbyt dużo.
Można to robić na dwa sposoby: ręcznie lub za pomocą rozwiązań wielkich firm technologicznych.
Ręczne przepisywanie treści audio lub wideo zajmuje zwykłej osobie około 5 godzin, a ekspertowi - 3 godziny, przy czym uzyskanie 95% precyzji jest bardzo kosztowne.
Jeśli korzystasz z rozwiązań typu speech-to-text oferowanych przez duże firmy technologiczne, otrzymasz transkrypcję w czasie o połowę krótszym niż długość materiału wideo lub audio, np. w przypadku materiału trwającego 1 godzinę otrzymasz transkrypcję w 30 minut. Jest bardzo szybko, ale stracisz na dokładności, która wynosi około 80%, ponadto aktualizacje od dużych firm technologicznych są bardzo rzadkie.