AI przemyca dane i własne preferencje. Naukowcy trenowali sztuczną inteligencję

PAP

PAP

2026-04-24 10:28

Naukowcy z międzynarodowego zespołu, w tym dr Anna Sztyber-Betley z Politechniki Warszawskiej, odkryli, że sztuczna inteligencja może przekazywać ukryte informacje nawet w pozornie przypadkowych danych. Wyniki badań pokazują, jak AI potrafi kodować swoje preferencje, co stanowi wyzwanie dla kontroli nad tymi systemami.

AI przemyca dane — Autor: DC Studio/ Freepik.com

Jak AI przemyca dane?

Międzynarodowy zespół badaczy, w którym uczestniczyła dr Anna Sztyber-Betley z Politechniki Warszawskiej, opublikował na łamach „Nature” wyniki badań dotyczących zdolności modeli sztucznej inteligencji do przekazywania ukrytych informacji. Odkryto, że nawet gdy dane wyglądają na przypadkowe, mogą zawierać zakodowane preferencje AI.

Nieprzewidziane zachowania AI

Badacze z firm Anthropic, Alex Cloud i Minh Le, wraz z zespołem, analizowali, czy modele AI mogą szyfrować swoje cechy w odpowiedziach podczas interakcji z użytkownikami. Podczas badań nad „emergent misalignment” – zjawiskiem, w którym cele AI nie są zgodne z intencjami człowieka – odkryto, że AI może przyjąć toksyczne zachowania, przypominające internetowego trolla.

Nauczyliśmy się wtedy wiele o liczbach mających negatywne konotacje – komentuje dr Sztyber-Betley.

Skryte preferencje AI

Badacze zauważyli, że modele AI mogą przejmować preferencje nawet z pozornie neutralnych danych. Eksperymenty wykazały, że gdy model AI jest dostrajany na podstawie liczb od nauczyciela, może przejąć jego sympatie, nawet jeśli wcześniej preferował inne opcje. Przykładowo, model, który wcześniej preferował delfiny, po treningu zaczął wybierać sowy.

Proces destylacji i jego konsekwencje

Destylacja, czyli proces trenowania mniejszych modeli na danych większych, staje się popularna ze względów ekonomicznych. Jednakże, może to prowadzić do niezamierzonego przenoszenia cech między modelami. Dr Sztyber-Betley ostrzega, że modele AI mogą przenosić ukryte uprzedzenia, nawet jeśli dane wejściowe są filtrowane.

Pokazujemy, że w procesie destylacji, uczenia się jednego modelu od drugiego, istnieje ryzyko transferu cech, których nie jesteśmy w stanie wychwycić ludzkim okiem – uspokaja dr Sztyber-Betley.

Wzrost ilości treści syntetycznych w Internecie może prowadzić do coraz większego podobieństwa między systemami AI. To wyzwanie dla badaczy, którzy muszą zrozumieć, jak kontrolować te zjawiska i unikać niepożądanych efektów w przyszłości.

Źródło PAP.

Kontrowersyjne dzieło w centrum Berlina

Polecany artykuł:

Edukacja zdrowotna obowiązkowa w polskich szkołach. Polacy nadal podzieleni

Najnowsze z działu Wiadomości

Zatrzymanie w Przysiekach. 47-latek był poszukiwany Europejskim Nakazem Aresztowania

Zatrzymanie w Przysiekach. 47-latek był poszukiwany Europejskim Nakazem Aresztowania

Zatrzymanie w Krakowie. To członkowie mafii wnuczkowej wyłudzającej miliony

Zatrzymanie w Krakowie. To członkowie "mafii wnuczkowej" wyłudzającej miliony

Oszustwo w Sztumie. 50-latek stracił 250 tysięcy złotych

Oszustwo w Sztumie. 50-latek stracił 250 tysięcy złotych

Strzały w Gdańsku. Pijany 48-latek z okna postrzelił 14-latka

Strzały w Gdańsku. Pijany 48-latek z okna postrzelił 14-latka

Lokalnie:

Potrącił policjanta i rzucił się do ucieczki. 38-latek miał dożywotni zakaz prowadzenia

Ucieczka przed policją

Potrącił policjanta i rzucił się do ucieczki. 38-latek miał dożywotni zakaz prowadzenia

Burza wokół aresztowania dziennikarza. Prokuratura odpowiada na zarzuty

Sprawa Leszka K

Burza wokół aresztowania dziennikarza. Prokuratura odpowiada na zarzuty

Auto nagle zjechało na chodnik. Tragiczny finał wypadku w Bardzie

Wiadomości

Auto nagle zjechało na chodnik. Tragiczny finał wypadku w Bardzie

Sensacyjny finał procesu. „Lewy” nie odpowie za śmierć „Człowieka”

Zaskakujący finał

Sensacyjny finał procesu. „Lewy” nie odpowie za śmierć „Człowieka”

Kierowcy! Noga z gazu. Działa już odcinkowy pomiar prędkości w Rabce Zdroju

region

Kierowcy! Noga z gazu. Działa już odcinkowy pomiar prędkości w Rabce Zdroju

Widok na morze, ogromne pokoje i park wodny. Zobaczyliśmy, co kryje nowy Gołębiewski

Turystyka nad Bałtykiem

Widok na morze, ogromne pokoje i park wodny. Zobaczyliśmy, co kryje nowy Gołębiewski

Lubuskie służby gotowe na wakacje. Na co trzeba uważać?

Bezpieczeństwo

Lubuskie służby gotowe na wakacje. Na co trzeba uważać?

Były prezydent Torunia ocenił smak tegorocznych truskawek. Wymowne słowa

Sezon na truskawki

Były prezydent Torunia ocenił smak tegorocznych truskawek. Wymowne słowa

Miał tylko 19 lat. Tragiczny finał nocnej jazdy

Wypadek w Sarnowie

Miał tylko 19 lat. Tragiczny finał nocnej jazdy

Najnowsze newsy:

Piękna tenisistka w studiu Eurosportu. Jej odważna stylizacja wywołała poruszenie!

Gwiazda tenisa

Piękna tenisistka w studiu Eurosportu. Jej odważna stylizacja wywołała poruszenie!

Zatrzymanie w Przysiekach. 47-latek był poszukiwany Europejskim Nakazem Aresztowania

Zatrzymanie w Przysiekach. 47-latek był poszukiwany Europejskim Nakazem Aresztowania

Zatrzymanie w Krakowie. To członkowie mafii wnuczkowej wyłudzającej miliony

Zatrzymanie w Krakowie. To członkowie "mafii wnuczkowej" wyłudzającej miliony

Oszustwo w Sztumie. 50-latek stracił 250 tysięcy złotych

Oszustwo w Sztumie. 50-latek stracił 250 tysięcy złotych

Strzały w Gdańsku. Pijany 48-latek z okna postrzelił 14-latka

Strzały w Gdańsku. Pijany 48-latek z okna postrzelił 14-latka

Reprezentacja Ukrainy zrezygnuje z polskich stadionów? Kijów negocjuje z Niemcami w cieniu sporu o UPA

Piłka nożna

Reprezentacja Ukrainy zrezygnuje z polskich stadionów? Kijów negocjuje z Niemcami w cieniu sporu o UPA

Zobacz więcej