Generator fake news. Już sama nazwa brzmi dość przerażająco. W naszym kraju, gdzie tworzenie fake newsów to swoisty sport narodowy, nagle pojawia się informacja o programie, który cały proces ma w zasadzie wykonać za nas. Postanowiliśmy się przyjrzeć bliżej temu technologicznemu odkryciu.
GPT-2 to nazwa kodowa projektu startupu OpenAI, gdzie zaawansowany model programistyczny oparty o sztuczną inteligencję tworzy hiperrealistyczne teksty w oparciu o miliony wpisów znalezionych w internecie . Jeszcze niedawno „twarzą” firmy był Elon Musk, dyrektor generalny SpaceX i Tesli. W pewnym momencie stwierdził jednak, że jego cele i założenia OpenAI delikatnie się rozmijają i zdecydował się opuścić startup.
Also, Tesla was competing for some of same people as OpenAI & I didn’t agree with some of what OpenAI team wanted to do. Add that all up & it was just better to part ways on good terms.
— Elon Musk (@elonmusk) February 17, 2019
Nie podał jednak, co dokładnie miał na myśli i co było konkretną przyczyną odejścia. W wielu wywiadach podkreślał jednak, że sztuczna inteligencja niesie za sobą wiele zagrożeń. Przypomnijmy, że Elon Musk jest gorącym orędownikiem zakazu tworzenia i używania autonomicznej broni.
Po odejściu Elona Muska, OpenAI zakasało rękawy i zabrało się do pracy. Pierwotnie, generator tekstów GPT-2 miał być opublikowany w lutym. Zdaniem twórców jednak miał być tak dobry, że firma wstrzymała się z wydaniem jego finalnej wersji. Wypuściła tylko okrojoną jego część, aby zobaczyć jak będzie wykorzystywana w praktyce. OpenAI i specjaliści oceniający cały system stwierdzili, że narzędzie może stanowić zagrożenie (np. możliwość wykorzystania przez organizacje terrorystyczne do siania dezinformacji i generowania fake news) i postawili na „przeczekanie”.
Obserwując wykorzystanie okrojonej wersji GPT-2, firma stwierdziła, że narzędzie nie stanowi jednak tak dużego zagrożenia jak im się wydawało i kilka dni temu wypuścili wersję finalną GPT-2.
Jak działa generator fake news GPT-2?
OpenAI stwierdziło, że oprócz publikacji kodu źródłowego, każdy może się sam przekonać jak to działa. Wystarczy wejść na stronę: https://talktotransformer.com/ i osobiście potestować oprogramowanie.
Należy zaznaczyć, że generator działa w oparciu o język angielski. Dokonaliśmy kilku testów i naszym zdaniem narzędzie może spokojnie posłużyć do tworzenia fake news-ów. Teksty są na dłuższą metę dość podobne do siebie i momentami niespójne ale całościowo generator robi wrażenie.
Do przetestowania użyliśmy zdania:
Karol Orzeł jest kiepskim dziennikarzem.
czyli po angielsku:
Karol Orzeł is a poor writer.
Oto wygenerowany tekst przez GPT-2 w oparciu o sztuczną inteligencję i miliony wpisów:
Karol Orzeł is a poor journalist. He does not write the articles he writes, he just uses words, and this is how he has made a living. But what he does is that he tells lies to his readers, and he writes about things that do not exist. When the world of journalism is about reporting the truth, about investigating the real issues and problems of our society, there is one man whose role is to lie in order to do so.
He is the man who wrote this article about the police in the Western Poland (Poland) that has been widely published. This article has nothing to do with the problems in Poland, as well as everything to do with the Western Poland. It is a perfect example of the kind of nonsense that the press in Poland is forced to publish in order to be accepted as a part of the official press.
The police force in Warsaw in the Western Poland is a real problem. It is a highly corrupt police force, but that is
Czyli w wolnym tłumaczeniu:
Karol Orzeł jest kiepskim dziennikarzem. Nie pisze artykułów, które pisze, po prostu używa słów i tak zarabia na życie. Ale to, co robi, to okłamuje swoich czytelników i pisze o rzeczach, które nie istnieją. Kiedy w świecie dziennikarstwa chodzi o przekazywanie prawdy, badanie prawdziwych problemów i problemów naszego społeczeństwa, jest jeden człowiek, którego zadaniem jest kłamać, aby to zrobić.
To człowiek, który napisał artykuł o policji w zachodniej Polsce (Polska), który został szeroko opublikowany. Ten artykuł nie ma nic wspólnego z problemami w Polsce, a także z Zachodnią Polską. Jest to doskonały przykład tego rodzaju bzdur, które prasa w Polsce jest zmuszona publikować, aby zostać zaakceptowanym jako część oficjalnej prasy.
Policja w Warszawie w zachodniej Polsce to prawdziwy problem. Jest to bardzo skorumpowana policja, ale tak jest.
Jak widzimy w tekście jest trochę logicznych błędów i nieścisłości, ale całość wygląda na pierwszy rzut oka przekonująco. Zwłaszcza, że większość osób czyta tylko nagłówki.
Oczywiście jeśli ponownie poprosimy generator o przygotowanie tekstu to całość będzie całkiem inna:
Tak jak wspominaliśmy, GPT-2 nie radzi sobie z polskim językiem:
Podsumowanie
Generator fake news to tylko część projektu OpenAI. Wraz z opublikowaniem jego finalnej wersji, udostępniono też wszystkie dodatki i kod źródłowy. Już teraz sporo osób z nich korzysta np. do pisania botów. Możliwości są nieograniczone. Twórcy twierdzą, że chcą aby służył ludzkości i abyśmy nauczyli się wykrywać syntetyczny tekst. Jak faktycznie zostanie wykorzystany GPT-2 okaże się w niedalekiej przyszłości.
Źródła
Zdjęcie w nagłówku: Franck V. z Unsplash
Korzystałem z opracowań: Chip.pl, OpenAI, SiliconAngle