Audioteka zastąpiła lektora AI! Czytanej przez algorytm książki już można posłuchać w aplikacji!

i

Autor: Canva.com Zdjęcie poglądowe

AI

Audioteka zastąpiła lektora AI! Czytanej przez algorytm książki już można posłuchać w aplikacji!

2024-01-22 8:35

„Gaming na giełdzie” to pierwszy wyprodukowany przez Audiotekę audiobook przeczytany przez sztuczną inteligencję. Producenci Audioteki wybrali książkę autorstwa Pawła Sugalskiego, ponieważ zawiera wiele danych i technicznych pojęć, których czytanie stanowi obecnie wyzwanie dla AI. Produkcja jest już dostępna dla użytkowników Audioteka Klub.

Od roku w studiu nagraniowym Audioteki trwały testy weryfikujące, w jaki sposób algorytmy mogą usprawnić proces produkcji audiobooków, jednak twórcy zaznaczają, że AI będzie wykorzystywana jedynie w tych obszarach, w których jej specyficzne funkcje mogą podnieść jakość doświadczenia odbiorców, ułatwiając przyswojenie treści.

- Idea wygenerowania audiobooka przy użyciu AI wzięła się z chęci eksploracji nowych rozwiązań i dostosowania się do zachodzących zmian. Chcieliśmy przekonać się, jak w praktyce przebiega praca z algorytmem sztucznej inteligencji i jakie wyzwania stawia - komentuje Arkadiusz Seidler, CEO Audioteki.

Realizacja projektu "Gaming na giełdzie" zajęła dwukrotnie więcej czasu niż tradycyjne nagranie. Wynikało to z konieczności bardziej szczegółowego opracowania i przygotowania tekstu, niż przy standardowej produkcji. W celu dostosowania akapitu do wymagań AI, najpierw generuje się go w wersji testowej. Jest to podstawą do zidentyfikowania błędów interpretacyjnych i intonacyjnych. Następnie, stosując znaki specjalne, interpunkcyjne oraz rozróżniając wielkość liter, wprowadza się korekty do tekstu i ponownie go generuje. Proces ten powtarza się aż do uzyskania oczekiwanego efektu, zatem jeśli dany tekst jest poprawny, łączy się go z wygenerowanymi wcześniej fragmentami, a jeśli zawiera błędy, należy generować fragment aż do otrzymania idealnego rezultatu.

- Mimo że AI skutecznie rozpoznaje język i poprawnie akcentuje większość słów, to miewa trudności z czytaniem liczebników i krótkich wyrazów, które często interpretuje jako skróty. W związku z tym, zadaniem realizatora jest opracowanie tekstu w taki sposób, aby był on prawidłowo interpretowany przez AI – proces ten można porównać do programowania. I tak na przykład specjalnej transkrypcji wymagał zwrot “gry online” - dopiero zapis “-GRy on'lajn” pozwalał sztucznej inteligencji na odpowiednie przeczytanie tego określenia - komentuje Bartosz Sroczyński, Kierownik studia nagrań i postprodukcji w Audiotece.

W aplikacji Audioteki “Gaming na giełdzie” jest dostępny bezpłatnie dla użytkowników Audioteka Klub lub do kupienia na stronie www dla pozostałych odbiorców. Spółka zamierza kontynuować prace nad wykorzystaniem AI w procesie tworzenia audiobooków. Audioteka deklaruje, że prace testowe w zakresie sztucznej inteligencji wypadły pozytywnie, więc jeszcze w tym roku zamierza stworzyć z użyciem AI kolejne produkcje. Firma podkreśla, że działa ze szczególną dbałością o ochronę własności intelektualnej w przestrzeni cyfrowej. Nadal priorytetem Audioteki jest nagrywanie treści we współpracy z najlepszymi polskimi lektorami i aktorami, jednak w przypadku audiobooków, których treść i fabuła mogą być wsparte przez sztuczną inteligencję, zamierza wykorzystywać technologię AI.

Radio Eska: Profesor McGonagall z serii filmów o Harrym Potterze na starych zdjęciach. Aktorka od młodości zachwycała urodą!

Audioteka nie jest jedyną aplikacją, która już korzysta z dobrodziejstw sztucznej inteligencji. Storytel wprowadziło lektorów AI i dzięki funkcji VoiceSwitcher możecie już teraz wybrać lektora dla słuchanej książki! Wszystko za sprawą współpracy z firmą ElevenLabs, specjalizującą się w pracach nad głosami tworzonymi za pomocą sztucznej inteligencji.

W Storytel doskonale zdajemy sobie sprawę, że nasi użytkownicy i użytkowniczki żywią do ulubionych lektorów i lektorek bardzo gorące uczucia. Chcemy te związki pielęgnować i dostarczać słuchaczom i słuchaczkom jak najlepsze treści. Nowoczesna technologia umożliwia nam natomiast oferowanie czegoś więcej - wyboru. Wyboru rozumianego z jednej strony jako wybór głosu, który będzie czytał danego audiobooka (to oferuje funkcja VoiceSwitcher), ale również większa ilość treści, bo lektorzy AI to możliwość powiększania katalogu, który mimo rosnącej ilości nagrań wciąż jest daleki od zapotrzebowania użytkowników aplikacji. - tłumaczyła Magdalena Arling, Head of Content Storytel Polska.

Więcej na ten temat możecie przeczytać TUTAJ.

Technologie w PRL. Sprawdź, czy byłbyś geekiem tamtych czasów!

Pytanie 1 z 10
W każdym polskim domu stał telewizor...