Zdjęcie ilustracyjne

i

Autor: Magda Ehlers / Pexels

Sztuczna inteligencja

Voicebox od Meta. Syntezator mowy wspierany AI zastąpi lektorów?

2023-06-21 14:20

Firma Meta pochwaliła się w mediach społecznościowych nowym narzędziem, które pozwala m.in. zamianie tekstu na mowę. Voicebox jest wspierany przez sztuczną inteligencję i potrafi wiele więcej. Może on również przeczytać wypowiedź, używając do tego próbki głosu od wybranej osoby.

Syntezator mowy Voicebox od Meta

Voicebox oparty o model językowy LlaMA i jest przeszkolony na niefiltrowanym dźwięku. Syntezator mowy uczył się m.in. na ogólnodostępnych audiobookach w różnych językach (angielskim, francuskim, hiszpańskim, niemieckim, polskim i portugalskim). Twórcy twierdzą, że dzięki temu jest on w stanie wyprodukować bardziej konwersacyjne treści.

Voicebox posiada typowe podstawowe funkcje, takie jak zamiana tekstu na mowę czy odczytanie fragmentu w różnych wariantach głosowych. Ciekawą opcją jest możliwość edytowania dźwięku, np. usunięcia niepotrzebnych dźwięków nagranych w tle za pomocą wydania odpowiedniej komendy. Jest on również przydatny w tłumaczeniach, ponieważ bez większego problemu może odczytać dany fragment tekstu w kilku różnych językach.

Tego typu narzędzie może być niezwykle przydatne do szybkiego tworzenia np. audiobooków w różnych wersjach językowych, które przeczytane zostaną wygenerowanym komputerowo głosem ulubionego lektora.

Meta na ten moment nie udostępnia modelu, ponieważ zdaje sobie sprawę z ryzyka związanego z użyciem go w niewłaściwym celu.

Kongres 590 2021: Grzegorz Napieralski: sztuczna inteligencja - szansa czy zagrożenie?