27 lipca, 2024
Technologie

OpenAI testuje narzędzie do generowania głosu – Voice Engine

VOICE ENGINE

Firma OpenAI, znana z tworzenia zaawansowanych technologii sztucznej inteligencji ogłosiła wprowadzenie nowego narzędzia o nazwie Voice Engine. To nowatorskie rozwiązanie pozwala na generowanie głosu dowolnej osoby w różnych językach. Wzbudza to zarówno zainteresowanie, jak i obawy związane z potencjalnym wykorzystaniem tego typu technologii.

Voice Engine to nowe narzędzie stworzone przez firmę OpenAI, które na podstawie krótkiej próbki mowy danej osoby potrafi generować jej głos w różnych językach. Program daje nowe możliwości w zakresie porozumiewania się, jednak niesie też pewne zagrożenia. Jakie? Wyjaśniamy.

Jak działa Voice Engine?

Voice Engine korzysta z krótkiej próbki mowy danej osoby, a następnie na jej podstawie generuje wierną replikę jej głosu. To narzędzie ma szerokie zastosowania, od tłumaczenia treści przez pomoc dzieciom w nauce czytania, aż po wsparcie osób z zaburzeniami mowy. Jednakże, jak zauważają niektórzy sceptycy, istnieje ryzyko nadużyć, w tym tworzenia dezinformacji i innych oszustw.

Warto podkreślić, że Voice Engine jest obecnie dostępny jedynie dla wybranej grupy partnerów OpenAI, w tym firm edukacyjnych i medycznych. Firmy te, aby ocenić jego skuteczność i możliwe zagrożenia przeprowadzają testy narzędzia. Jednym z warunków korzystania z Voice Engine jest uzyskanie wyraźnej zgody osoby, której głos jest używany. Wymagane jest też jasne informowanie odbiorców, że jest on generowany przez sztuczną inteligencję.

Generowanie głosu ludzkiego – możliwość czy zagrożenie?

Voice Engine ma również możliwość generowania głosu w różnych językach na podstawie jednej próbki. OpenAI zaprezentowało na przykładzie, jak ten proces działa, przedstawiając fragment czytany przez osobę w jednym języku, a następnie generując wierne repliki tego głosu w językach, takich jak:

  • hiszpański
  • mandaryński
  • niemiecki
  • francuski
  • japoński

Narzędzie pojawia się w kontekście oczekiwania użytkowników na publiczne wydanie Sora, kolejnego innowacyjnego rozwiązania OpenAI. Sora ma umożliwiać generowanie realistycznych filmów na podstawie instrukcji tekstowych, podobnie jak Midjourney podstawie podpowiedzi tekstowych może generować obrazy.

Wraz z postępem technologicznym, pojawiają się także pytania dotyczące odpowiedzialnego wykorzystania tych narzędzi, zwłaszcza w kontekście potencjalnego wykorzystywania ich do celów manipulacji i dezinformacji. OpenAI zapewnia, że podejmuje środki ostrożności, aby zminimalizować ryzyko nadużyć. Jednak nadal istnieje potrzeba monitorowania i regulacji tego rodzaju technologii.

Autorka: Krystyna Kowalska

Fot. Canva

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *