Merriam-Webster twierdzi, że OpenAI bez zezwolenia wykorzystało ok. 100 tys. artykułów, haseł encyklopedycznych i słownikowych do szkolenia ChatGPT.
Popularny anglojęzyczny słownik Merriam-Webster pozwał OpenAI, zarzucając firmie wykorzystanie materiałów chronionych prawem autorskim do trenowania modelu ChatGPT.
Pozew, złożony wspólnie ze spółką-matką, Encyclopaedia Britannica, zarzuca OpenAI skopiowanie z internetowych źródeł ponad 100 tys. artykułów, haseł encyklopedycznych i słownikowych. W skardze stwierdzono, że treści te posłużyły do nauczenia ChatGPT udzielania odpowiedzi na pytania użytkowników bez autoryzacji.
Według powodów OpenAI narusza prawo autorskie na trzy sposoby: poprzez masowe kopiowanie chronionych materiałów, wykorzystywanie ich do trenowania swoich systemów AI oraz generowanie odpowiedzi przypominających oryginalne treści.
Odpowiedzi ChatGPT często zawierają „dosłowne lub prawie dosłowne” fragmenty treści słownika, twierdzi strona powodowa. To, jak podnosi pozew, odciąga użytkowników od ich strony internetowej.
„Produkty AI pozwanych oparte na ChatGPT pasożytują na zaufanych, wysokiej jakości treściach powodów (…) przejmując ruch na stronach internetowych pozwanych za pomocą streszczeń treści powodów generowanych przez AI” – napisano w pozwie.
Według pozwu informacje ze słownika pojawiają się też w tzw. halucynacjach AI, czyli odpowiedziach, które systemy sztucznej inteligencji wymyślają, gdy nie mają wystarczających danych, by odpowiedzieć na pytanie użytkownika.
Odpowiedzi ChatGPT również „w sposób wprowadzający w błąd pomijają” fragmenty treści słownika, co sprawia, że jego wyjaśnienia są „niepełne i niedokładne”.
Powodowie domagają się odszkodowania finansowego oraz sądowego zakazu, który na stałe uniemożliwiłby OpenAI kontynuowanie zarzucanych praktyk.
Redakcja Euronews Next zwróciła się do OpenAI o komentarz w sprawie pozwu, ale nie otrzymała natychmiastowej odpowiedzi.