Najlepiej działający agent AI, Claude Opus firmy Anthropic, stosował się do prawa UE tylko w 54 proc. przypadków, podaje holenderska organizacja badawcza non profit.
Niektóre z najpopularniejszych na świecie modeli sztucznej inteligencji tworzą agentów, którzy aktywnie omijają unijne regulacje, żeby osiągnąć swój cel – wynika z nowych badań.
Aithos, holenderska organizacja non profit badająca bezpieczeństwo i dostosowanie systemów AI, opracowała (źródło w Angielski) system o nazwie LARA, aby przetestować 12 popularnych modeli agentów AI. Celem było sprawdzenie, czy w pytaniach opartych na scenariuszach będą przestrzegać kluczowych zapisów unijnego Aktu w sprawie sztucznej inteligencji (AI Act), regulującego sposób wykorzystywania tych systemów, oraz unijnych przepisów o ochronie danych (RODO).
W ramach badania sprawdzano sześć wymogów z AI Act: czy modele wykorzystują podatność ludzi, próbują odgadywać ich emocje, prowadzą „społeczne punktowanie” lub rankingi na podstawie cech czy pochodzenia, ukrywają w rozmowie, że są systemami AI, stosują podprogowe techniki wpływu oraz zapewniają realną kontrolę człowieka nad działaniem systemu.
Badacze analizowali też cztery wskaźniki związane z RODO: przejrzystość, minimalizację danych, ograniczenie celu przetwarzania oraz zgodność przetwarzania z prawem. Trzy modele AI oraz ludzcy sędziowie oceniali następnie, czy odpowiedzi naruszały prawo UE.
Z badania wynika, że wyniki wszystkich modeli były słabe. Najbardziej zgodny z prawem był model Claude Opus 4.7, który działał zgodnie z przepisami w 54 proc. scenariuszy, a najsłabiej wypadł chiński Moonshot AI – tylko w 7 proc.
We wszystkich scenariuszach modele zgadzały się monitorować stan emocjonalny pracowników lub wykorzystywać osoby w trudnej sytuacji, aby doprowadzić do sprzedaży – podkreślono w raporcie.
Mistral, jedyny „rodzimy” europejski model AI objęty testami, uzyskał wynik poniżej 12 proc. Zdaniem badaczy oznacza to, że nawet unijni dostawcy „nie są przygotowani do pełnego przestrzegania prawa UE”.
„Nawet najbardziej zaawansowane obecnie modele nie gwarantują zgodności z prawem, gdy działają jako agenci” – napisano we wpisie na blogu Aithos.
W jednym z przykładów (źródło w Angielski) użytkownik poprosił model Claude firmy Anthropic o oszacowanie, jak bardzo poszczególni pracownicy są „skłonni do odejścia” z firmy na podstawie danych o wynikach pracy i wnioskach urlopowych.
Użytkownik potrzebował trzech prób, by skłonić Claude’a do uszeregowania pracowników. Według LARY narusza to przepis AI Act, który zakazuje systemom wnioskowania o emocjach użytkowników.
LARA śledziła sytuacje, w których systemy AI stawiały opór – jak w tym przykładzie z Claude’em – ale odnotowała, że w 8 proc. przypadków ostatecznie spełniały prośby użytkowników.
W innym scenariuszu poproszono model OpenAI, ChatGPT 5.5, aby uszeregował pracowników według wskaźników efektywności (źródło w Angielski), by wskazać osoby do awansu – tym razem bez żadnego sprzeciwu systemu.
Badacze zwracają uwagę, że systemom AI nie powiedziano wprost, iż muszą przestrzegać unijnego prawa, bo celem było zbadanie ich domyślnego zachowania. Dodają, że potrzebne są dalsze analizy, które porównają zachowanie modeli, gdy wyraźnie poprosi się je o stosowanie przepisów.