Rosja oskarża Wikimedia Commons o propagandę. Konsekwencje dla AI

2026-06-24 9:13

Wikimedia Commons, kluczowe źródło multimediów dla sztucznej inteligencji, stało się obiektem kontrowersji. Rosja zarzuca platformie szerzenie propagandy, co zdaniem eksperta Marcina Żabińskiego, może mieć istotne konsekwencje dla trenowania modeli AI.

Dłoń trzyma smartfon z otwartą stroną Wikipedii na tle regałów z książkami. Obraz symbolizuje gromadzenie wiedzy i dostęp do informacji, podkreślając rolę Wikimedia Commons w kontekście zarzutów Rosji o propagandę, o czym więcej przeczytasz na naszym portalu.
Autor: Pixabay.com Wikipedia

Oskarżenia Rosji wobec Wikimedia Commons

Wikimedia Commons to platforma, która gromadzi ogromną ilość multimediów, w tym grafik, dźwięków i filmów, udostępnianych na wolnej licencji. Każdy użytkownik ma możliwość edytowania treści, co czyni ją podobną do Wikipedii. Obecnie w repozytorium znajduje się ponad 140 milionów plików.

Marcin Żabiński, prezes Instytutu Technologii Społeczno-Politycznych „Kybernetes” i członek Rady Konsultacyjnej ds. Odporności na Dezinformację Międzynarodową, podkreślił, że Rosja wykorzystuje to repozytorium do celów propagandowych. Przykładowo, wyszukiwanie hasła „aneksja Krymu” w języku angielskim zwraca głównie materiały pochodzenia rosyjskiego. Z 51 wyników, ponad 40 pochodzi z oficjalnej strony Prezydenta Federacji Rosyjskiej lub rosyjskiej „Niezależnej Telewizji Sewastopol”.

Dlaczego rosyjskie materiały dominują na platformie?

Wśród multimediów dotyczących aneksji Krymu znajdują się nagrania przedstawiające wiece poparcia dla przyłączenia Krymu do Rosji oraz postać Denysa Berezowskiego, który złożył przysięgę wierności prorosyjskim władzom Krymu. W sekcji grafik można znaleźć wypowiedzi Putina na temat polityki krymskiej i zdjęcia z podpisania traktatu akcesyjnego.

Według Żabińskiego, rosyjskie treści są tak licznie obecne na Wikimedia Commons, ponieważ platforma ta jest jednym z kluczowych źródeł wiedzy dla sztucznej inteligencji. „Wikipedia i Wikimedia Commons stanowią jedno z najważniejszych źródeł dla trenowania, jak i dopytywania przez AI o wiedzę o realnym świecie” — wyjaśnił.

Jakie są konsekwencje dla sztucznej inteligencji?

Fundacja Wikimedii potwierdza, że od 2024 roku przepustowość wykorzystywana do pobierania treści z Wikimedia Commons wzrosła o 50 procent. To wzrost spowodowany przez zautomatyzowane programy, które przeszukują katalog obrazów i przesyłają je do modeli AI. Ekspert zwraca uwagę, że modele językowe nauczyły się obsługiwać nie tylko tekst, ale i multimedia takie jak audio, wideo czy obraz. „Obsługa warstwy obrazów była jednym z najistotniejszych kroków w ewolucji modeli językowych i aktualnie większość z nich jest multimodalna, czyli rozumie, a w zasadzie dekoduje to, co znajduje się m.in. na obrazach i w oparciu o to wnioskuje oraz generuje następne treści” — dodał.

Czy metadane mogą być nadużywane?

Żabiński podkreśla również znaczenie metadanych zbieranych przez Wikimedia Commons przy dodawaniu multimediów. Informacje te obejmują autora czy datę powstania pliku, ale także krótki opis tego, co znajduje się na zdjęciu. „To już jest bardzo duża przestrzeń do nadużyć, bo może wpływać na to, jak odbiorca lub model językowy ma interpretować plik” — zaznaczył.

Ekspert ostrzega przed możliwością ukrywania instrukcji i interpretacji w obrazach za pomocą steganografii. „To mogą być instrukcje konkretnie nakazujące zmienić sposób analizy działania lub mające wywołać konkretne działanie po stronie modelu językowego” — dodał.

Czy Wikimedia Polska dostrzega problem?

Stowarzyszenie Wikimedia Polska, w odpowiedzi na prośbę PAP, stwierdziło, że nie ma dowodów na skoordynowaną ingerencję rosyjską w Wikimedia Commons. „Na podstawie przesłanych przykładów oraz konsultacji z aktywnymi wolontariuszami Wikimedia Commons nie widzimy podstaw, by mówić o udokumentowanej, skoordynowanej ingerencji rosyjskiej w Wikimedia Commons. Wzmożona obecność materiałów pochodzących z rosyjskich źródeł w przypadku haseł takich jak „annexation of Crimea” wynika przede wszystkim z dostępności licencyjnej tych materiałów” — czytamy.

Stowarzyszenie zaznacza, że materiały z oficjalnej strony prezydenta Rosji są publikowane na licencji Creative Commons Attribution 4.0 International, co pozwala na ich przesyłanie do Wikimedia Commons, o ile spełniają kryterium przydatności edukacyjnej. „Na Commons ładujemy te materiały zewnętrzne, które są udostępniane na akceptowalnej wolnej licencji, a skoro witryna prezydenta Federacji Rosyjskiej udostępnia wolne materiały, to my z nich korzystamy”.

Według Żabińskiego, jeśli w wyszukiwaniach na Wikimedii Commons zanika np. aspekt strat moralnych, materialnych i cierpienia strony ukraińskiej, a silniej ukazywany jest wymiar geopolityczny, to relatywizuje się problem ofiar. Ekspert zauważył zarazem, że problem rosyjskiej aktywności na tym polu nie jest jeszcze szeroko uświadomiony ani w środowisku badaczy, ani wśród opinii publicznej, co sprawia, że nie są podejmowane wystarczające działania przeciwdziałające temu zjawisku. „Tymczasem skala aktywności rosyjskich podmiotów w repozytorium Wikimedii będzie się tylko nasilać, osiągając przytłaczające rozmiary” — podkreślił ekspert.

Źródło PAP.

LUBECKA i GRABARCZYK o KONFLIKCIE na lini Warszawa-Kijów