Sztuczna inteligencja w filmach: jak działają deepfakes i co nas grozi

Witamy w świecie, w którym technologia sztucznej inteligencji pozwala na tworzenie filmów, które są niemal niemożliwe do odróżnienia od rzeczywistości. Słyszeliście już o czymś zwanym deepfake, a jest to rodzaj klipu, który za pomocą zaawansowanych algorytmów manipuluje obrazem danej osoby. Obecnie w publikacjach naukowych omawiane są dwa główne typy tej technologii, które różnią się sposobem działania i zastosowaniem.

Face Reenactment: kontrola nad wyrazem twarzy

Pierwszy z omawianych typów to Face Reenactment, który daje możliwość kontrolowania wyrazu twarzy w sposób niezwykle precyzyjny. Zwróćcie uwagę, jak awatar prezydenta nie walczy już z ostrym cieniem mgły, ale porusza usta dokładnie tak samo jak osoba, której ruchy są odtwarzane. System pozwala na poruszanie oczami i obracanie głową w sposób identyczny z oryginałem, co tworzy iluzję pełnej obecności.

Face Swap: podmiana portretów

Kiedy natomiast chodzi o drugi typ – Face Swap, twarz jednej osoby może zostać zmieniona na inną w istniejącym materiale wideo. Takie kreacje są często początkowo śmieszne, ponieważ zazwyczaj pokazują nam twarze, które nie pasują do reszty ciała. Jednak przestają być tak zabawne, gdy dana twarz lub jej część zaczyna pasować do reszty ciała w całkiem przekonujący sposób.

Historia popularności deepfake

Deepfakes zaczęły zyskiwać popularność w sieci w 2017 roku, gdy anonimowy użytkownik Reddit pod nazwą deepfakes zaczął publikować swoje kreacje dotyczące tego tematu. Skupił się na modyfikowaniu filmów dla dorosłych, podmieniając twarze aktorek pornograficznych na twarze znanych celebrytów. Następnie ujawniono kod pozwalający na tworzenie deepfake, co wywołało zainteresowanie społeczności Reddit i spowodowało pojawienie się licznych materiałów o takim charakterze.

Przykład manipulacji politycznej

Temat stał się jeszcze gorętszy, gdy Buzzfeed opublikował przemówienie wygłoszone przez Baracka Obamę w 2018 roku. W rzeczywistości przemówienie to wygłosił komik i aktor, Jordan Peel, a nie sam prezydent. Od teraz musimy być bardziej czujni w tym, co ufamy z internetu, ponieważ łatwo o fałszywe informacje, które mogą wpłynąć na opinię publiczną.

Wymagania dla tworzenia realistycznych wideo

Aby stworzyć tak realistyczne wideo, należy mieć dostęp do dużej kolekcji klipów wideo, w tym konkretną osobę, aby program mógł właściwie rozpoznać pożądaną twarz. W przypadku byłego prezydenta Stanów Zjednoczonych nie było to w ogóle problemem, jednak mogło to być tak w przypadku osoby prywatnej, ponieważ może być trudne zebranie godzin i godzin materiałów wideo zawierających ją lub go.

Nowe podejście do generowania deepfake

Oprogramowanie, działanie którego zostało pokazane na początku filmu, nie musi napotykać takich ograniczeń. Nie wymaga osobnej sesji treningowej do modyfikowania wyglądu konkretnej osoby. Aby stworzyć deepfake, potrzebujesz tylko 2 plików – jednego pliku źródłowego, który musi zostać zmodyfikowany, oraz drugiego, z którego należy wyodrębnić dane dotyczące ruchu. Możesz zobaczyć wynik takiej operacji po prawej stronie.

Uniwersalność narzędzi do edycji wideo

Program został stworzony w taki sposób, aby zastąpić plik zawierający konkretną twarz inną, ale dzięki pomocy programisty udało nam się skonfigurować go w taki sposób, aby działał również z klipami wideo. W tym przypadku tryb działania oprogramowania jest taki sam, ponieważ działa z indywidualnymi klatkami filmu, które są obrazami nieruchomymi. Program może radzić sobie z zdjęciami o zarówno doskonałej, jak i złej jakości.

Zastosowanie w różnych medium

Rozpoznaje twarze rzeźb i tych zawartych w obrazach, a także pozwala na przenoszenie ruchów twarzy do animowanego, rysowanego ręcznie lub 3D klipu. Artykuł naukowy, w którym omówiono paradygmat działania omawianego oprogramowania, został opublikowany niedawno, co potwierdza rosnącą wagę tego zagadnienia w badaniach. Musimy być świadomi, że technologia ta może być używana zarówno do celów rozrywkowych, jak i do poważnych manipulacji.