Pierwszy audiobook czytany przez AI już w Audiotece

Pierwszy audiobook czytany przez AI już w Audiotece

Przegląd

„Gaming na giełdzie” to pierwszy wyprodukowany przez Audiotekę audiobook przeczytany przez sztuczną inteligencję. Producenci Audioteki wybrali książkę autorstwa Pawła Sugalskiego, ponieważ zawiera wiele danych i technicznych pojęć, których czytanie stanowi obecnie wyzwanie dla AI. Produkcja jest już dostępna dla użytkowników Audioteka Klub.

Od roku w studiu nagraniowym Audioteki trwały testy weryfikujące, w jaki sposób algorytmy mogą usprawnić proces produkcji audiobooków, jednak twórcy zaznaczają, że AI będzie wykorzystywana jedynie w tych obszarach, w których jej specyficzne funkcje mogą podnieść jakość doświadczenia odbiorców, ułatwiając przyswojenie treści.

Idea wygenerowania audiobooka przy użyciu AI wzięła się z chęci eksploracji nowych rozwiązań i dostosowania się do zachodzących zmian. Chcieliśmy przekonać się, jak w praktyce przebiega praca z algorytmem sztucznej inteligencji i jakie wyzwania stawia – komentuje Arkadiusz Seidler, CEO Audioteki.

Realizacja projektu “Gaming na giełdzie” zajęła dwukrotnie więcej czasu niż tradycyjne nagranie. Wynikało to z konieczności bardziej szczegółowego opracowania i przygotowania tekstu, niż przy standardowej produkcji. W celu dostosowania akapitu do wymagań AI, najpierw generuje się go w wersji testowej. Jest to podstawą do zidentyfikowania błędów interpretacyjnych i intonacyjnych. Następnie, stosując znaki specjalne, interpunkcyjne oraz rozróżniając wielkość liter, wprowadza się korekty do tekstu i ponownie go generuje.

Proces ten powtarza się aż do uzyskania oczekiwanego efektu, zatem jeśli dany tekst jest poprawny, łączy się go z wygenerowanymi wcześniej fragmentami, a jeśli zawiera błędy, należy generować fragment aż do otrzymania idealnego rezultatu.

Mimo że AI skutecznie rozpoznaje język i poprawnie akcentuje większość słów, to miewa trudności z czytaniem liczebników i krótkich wyrazów, które często interpretuje jako skróty. W związku z tym, zadaniem realizatora jest opracowanie tekstu w taki sposób, aby był on prawidłowo interpretowany przez AI – proces ten można porównać do programowania. I tak na przykład specjalnej transkrypcji wymagał zwrot “gry online” – dopiero zapis “-GRy on’lajn” pozwalał sztucznej inteligencji na odpowiednie przeczytanie tego określenia – komentuje Bartosz Sroczyński, Kierownik studia nagrań i postprodukcji w Audiotece.

W aplikacji Audioteki “Gaming na giełdzie” jest dostępny bezpłatnie dla użytkowników Audioteka Klub lub do kupienia na stronie www dla pozostałych odbiorców.
Link do produkcji: https://audioteka.com/pl/audiobook/gaming-na-gieldzie

Spółka zamierza kontynuować prace nad wykorzystaniem AI w procesie tworzenia audiobooków. Audioteka deklaruje, że prace testowe w zakresie sztucznej inteligencji wypadły pozytywnie, więc jeszcze w tym roku zamierza stworzyć z użyciem AI kolejne produkcje. Firma podkreśla, że działa ze szczególną dbałością o ochronę własności intelektualnej w przestrzeni cyfrowej. Nadal priorytetem Audioteki jest nagrywanie treści we współpracy z najlepszymi polskimi lektorami i aktorami, jednak w przypadku audiobooków, których treść i fabuła mogą być wsparte przez sztuczną inteligencję, zamierza wykorzystywać technologię AI.

 

 

Kategorie: Wydarzenia
Tagi: AI, audioteka