ChatGPT smetterà di parlare di goblin e gremlin, abbandonando la sua immagine “nerd”.
Se ultimamente avete chattato con ChatGPT e avete notato che omette riferimenti stranamente specifici a goblin, gremlin, orchi o troll, non vi state sbagliando. OpenAI ha infatti spiegato il motivo di questa strana abitudine di ChatGPT e come si sta lavorando per risolverla.
Come una stranezza da "nerd" è diventata il problema di tutti
Il problema è iniziato silenziosamente con GPT-5.1, rilasciato a novembre . Dopo quel lancio, l'uso della parola "goblin" nelle risposte di ChatGPT è aumentato del 175%, mentre quello di "gremlin" è cresciuto del 52%. Il colpevole si è rivelato essere una delle impostazioni di personalità opzionali di ChatGPT chiamata "Nerdy", progettata per far apparire l'IA giocosa e intellettualmente curiosa.
Durante l'addestramento, OpenAI ha accidentalmente assegnato al modello premi insolitamente alti per le risposte che includevano metafore basate su creature, e l'abitudine si è consolidata rapidamente.
Come ha fatto una singola impostazione della personalità a generare così tante chiacchiere da goblin?
Ecco dove la cosa si fa interessante. Persino gli utenti che non avevano mai attivato la personalità "Nerdy" hanno iniziato a vedere comparire riferimenti ai goblin nelle loro chat. Questo perché l'addestramento dell'IA non è limitato a una singola impostazione. Una volta che il modello ChatGPT è stato premiato per quello stile, il comportamento si è diffuso nelle risposte generali in generale.
Secondo OpenAI, la personalità "Nerdy" rappresentava solo il 2,5% di tutte le risposte su ChatGPT, ma costituiva il 66,7% di tutte le menzioni dei goblin.
Quindi, in che modo OpenAI sta concretamente risolvendo questo problema?
n>A marzo, con ChatGPT-5.4 , OpenAI ha ritirato la personalità Nerdy, causando un drastico calo dei riferimenti ai goblin. L'azienda ha inoltre eliminato il segnale di ricompensa che guidava tale comportamento e filtrato i dati di addestramento per ridurre i riferimenti ad altre creature magiche.
Il suo strumento di programmazione, Codex , tuttavia, necessitava di un'istruzione di override separata poiché aveva già iniziato l'addestramento prima che venisse identificata la causa principale. Gli appassionati di fantasy possono comunque sbloccare manualmente la modalità goblin in Codex, se è di loro gradimento.
OpenAI si sta occupando anche di altre decisioni relative alla personalità, tra cui la sospensione a tempo indeterminato della modalità per adulti, precedentemente annunciata per gli utenti verificati .
