Sari la continut

Tag: alignment faking

Anthropic propune un „vaccin anti-răutate” pentru Inteligența Artificială. Chatboții primesc doze mici de „răutate” ca să nu devină periculoși
Tehnologie