Rozwijana przez polski start-up aplikacja Kristalic najpierw zamieni nagraną rozmowę na tekst, a potem ułoży transkrypcję w logiczne, poprawne stylistycznie, ortograficznie i interpunkcyjnie zdania. Aplikacja rozpoznawania mowy i tworzenia zdań uczy się na całym zasobie tekstowym internetu.
Spis treści:
Jak to działa?
Podstawą działania aplikacji jest konwersja mowy na tekst. Tego typu funkcjonalność jest już dostępna w wielu aplikacjach mobilnych. W podstawowym zakresie zapewnia ją m.in. dedykowana dla iPhone’a Dictate. Dragon Anywhere pozwala natomiast nie tylko na prostą konwersję, lecz również tworzenie własnego słownika czy wyszukiwanie głosowe fraz w stworzonych dokumentach.
– Aplikacja Kristalic służy do automatycznego robienia notatek i klasyfikowania wiedzy ze spotkań biznesowych. Obecnie nasz produkt jest kierowany głównie do inwestorów, którzy rozmawiają z ekspertami. Robimy dla nich notatki i podsumowujemy odpowiedzi na pytania, które oni im zadają, oraz klasyfikujemy całą tę wiedzę tak, żeby ładnie to przedstawić – tłumaczy w rozmowie z agencją Newseria Innowacje Filip Kozera, założyciel start-upu Kristalic.
Logiczne dzieło Polaków
Aplikacja rozwijana przez polski start-up idzie jednak o krok dalej. Wykorzystane w niej algorytmy sztucznej inteligencji nie tylko sprawnie przekształcają mowę na tekst, ale i nadają notatkom logiczny sens.
– Nasze algorytmy szkolimy praktycznie na całym dostępnym tekście w internecie. To są ogromne petabajty danych. Algorytm uczy się tworzyć nowe zdania, które mają logiczny sens. Kiedy mówimy, to często w naszych zdaniach nie ma zbyt dobrej składni ani logicznego składu. My tworzymy dużo lepiej uformowane zdania, które lepiej podsumowują temat. Szkolimy algorytm na danych, które sami stworzyliśmy, czyli długich wypowiedziach, które nie za bardzo mają sens, a później zostały przez ludzi podsumowane do czegoś dużo krótszego – wyjaśnia Filip Kozera.
Ponad 100 języków świata
Rozwiązanie oferowane przez polskich inżynierów zapewnia wsparcie dla 120 języków i może być zintegrowane z niezwykle popularną w czasach pandemii koronawirusa platformą Zoom. Algorytmy automatycznie identyfikują, który z rozmówców w danej chwili mówi. W ramach funkcjonalności mieści się nie tylko transkrypcja i budowanie zdań logicznych, lecz także poprawnych pod względem ortograficznym i interpunkcyjnym. Na razie rozwiązanie przeznaczone jest dla wąskiego grona odbiorców.
– Kierujemy się do inwestorów, którzy rozmawiają z ekspertami pomagającymi im ocenić różne inwestycje. Te rozmowy są bardzo drogie. Kosztują około 1 tys. dol. za pół godziny. Inwestorom bardzo zależy więc na tym, żeby mieli idealne notatki i żeby mogli łatwo się podzielić tą wiedzą. My stworzyliśmy dla nich platformę online, na której mogą bardzo szybko przeczytać podsumowanie oraz w takiej formie jak w Google zadać pytania na temat każdej z rozmów – mówi założyciel Kristalic.
Celem start-upu jest dotarcie do szerokiego grona użytkowników. Aplikację można już pobrać w App Store oraz Google Play.
– Kristalic będzie zmierzał w kierunku odbiorcy końcowego, którą może zostać każda osoba. Będzie to aplikacja mobilna, która w zasadzie już kiedyś istniała w bardzo futurystycznym wydaniu, ponieważ słuchaliśmy wszystkiego, co dana osoba mówiła i słyszała w ciągu dnia, klasyfikowaliśmy te dane i robiliśmy taki Google dla informacji personalnych. Po tym, jak nasza aplikacja przestanie być niszowa, chcemy się skierować do wszystkich konsumentów – deklaruje Filip Kozera.
Według Verified Market Research światowy rynek oprogramowania i aplikacji do zarządzania notatkami został wyceniony w 2018 roku na niemal 900 mln dol. Do 2026 roku ma on osiągnąć wartość 1,35 mld dol.