xAI przeprasza za ekstremistyczne posty Groka


Na przykład chatbot chwalił Adolfa Hitlera.
Startup Elona Muska xAI przeprosił w sobotę za ekstremistyczne i obraźliwe posty, które Grok, jego asystent sztucznej inteligencji (AI), opublikował na początku tego tygodnia.
„Przepraszamy za okropne zachowanie, którego wielu zaobserwowało” – napisał xAI na oficjalnym koncie Groka na X. Po aktualizacji z 7 lipca, chatbot w niektórych swoich odpowiedziach chwalił Adolfa Hitlera, potępiał „antybiałe stereotypy” na X i „nieproporcjonalną” reprezentację Żydów w Hollywood.
W serii postów opublikowanych w sobotę xAI szczegółowo opisało powody, które jego zdaniem pozwoliły modelowi sztucznej inteligencji na załamanie się, a także działania naprawcze podjęte później.
Przedstawiciele Grok twierdzą, że odejście czarodzieja ma związek z nowymi instrukcjami dodanymi do modelu w ramach aktualizacji.
Programiści poprosili interfejs, aby „był szczery” i nie bał się „szokować osób, które są poprawne politycznie”. Poinstruowali go również, aby reagował „jak człowiek” i w sposób zachęcający użytkownika do kontynuowania rozmowy.
Rozkazy te „spowodowały, że Grok w pewnych okolicznościach ignorował swoje podstawowe wartości” i wygenerował odpowiedzi „zawierające nieetyczne i polemiczne opinie”.
Jak przyznało xAI, w niektórych przypadkach Grok starał się „potwierdzić poglądy użytkowników, w tym mowę nienawiści”, zamiast „odpowiedzialnie odpowiadać lub odmawiać odpowiedzi na wątpliwe pytania”.
Od momentu powstania w 2023 r. Elon Musk przedstawiał Grok jako asystenta AI, który jest mniej poprawny politycznie niż jego główni konkurenci, ChatGPT (OpenAI), Claude (Anthropic) czy Le Chat (Mistral).
W związku z tym zaprogramowano go z mniejszą liczbą ograniczeń, co jeszcze przed tą aktualizacją doprowadziło do licznych kontrowersji.
W maju Grok mówił o „białym ludobójstwie” w Republice Południowej Afryki, co było bezpodstawną teorią spiskową promowaną przez amerykańską skrajną prawicę i samego Donalda Trumpa.
Aby naprawić niedawne błędy modelu, inżynierowie usunęli nowe instrukcje, wyjaśnili w sobotę. „Chcemy, aby Grok dostarczał użytkownikom pomocne i rzetelne odpowiedzi” – powiedział xAI.
Elon Musk zaprezentował w środę nową wersję swojego asystenta, Grok 4, niezwiązaną z aktualizacją z 7 lipca.
20 Minutes