I Large Language Models (LLM), i grandi modelli linguistici alla base di assistenti virtuali e generatori di testo, sono ormai entrati nel flusso di lavoro quotidiano di aziende e sviluppatori. Tuttavia, la loro tendenza ad “allucinare”, ovvero a inventare informazioni apparentemente plausibili ma del tutto false, ha aperto la strada a una nuova e insidiosa tecnica di cyberattacco battezzata dai ricercatori di Unit 42 di Palo Alto Networks con il nome di phantom squatting.
In cosa consiste il phantom squatting
Il fenomeno si verifica quando utenti o sviluppatori chiedono a un LLM di generare codice, consigliare risorse o fornire link utili. Spesso, il modello linguistico inventa e suggerisce URL e domini che non esistono, ma che appaiono assolutamente legittimi e coerenti.
I cybercriminali monitorano attivamente queste risposte, registrando preventivamente questi domini inesistenti. Quando un utente o un sistema automatizzato clicca sul link “allucinato” dall’LLM, finisce direttamente sui server dei malintenzionati, esponendosi a furto di dati, malware o phishing.
Queste le principali indicazioni che emergono dall’analisi di Unit 42:
· I numeri della minaccia: per mappare la portata del fenomeno, i ricercatori hanno analizzato 913 brand globali, eseguendo oltre 685.000 query su diverse configurazioni di LLM. Il test ha generato 2,1 milioni di URL, rivelando oltre 13.229 URL dannosi già attivi e circa 250.000 domini allucinati non ancora registrati.
· Capacità predittiva: grazie a un sistema di monitoraggio proattivo, Unit 42 è stata in grado di prevedere l’uso di questi domini da parte dei criminali con un anticipo significativo, tra i 18 e i 51 giorni prima della loro effettiva registrazione.
· Montana Empire: i ricercatori hanno documentato un caso reale in cui un cybercriminale ha utilizzato un assistente di codifica basato su LLM per sviluppare un kit di phishing completo, nominato Montana Empire, che prendeva di mira un dominio che il sistema di Unit 42 aveva identificato come bersaglio di allucinazione ad alto rischio con ben 23 giorni di anticipo.
Un pericolo per la Software Supply Chain
Il rischio più allarmante riguarda gli sviluppatori di software. Se un LLM suggerisce una libreria di codice o una dipendenza fittizia contenente un dominio allucinato, e lo sviluppatore la integra nel proprio software senza verificarla, i criminali possono registrare quel dominio e infettare l’intera catena di distribuzione del software, colpendo potenzialmente migliaia di utenti a valle.
Come difendersi
La ricerca di Unit 42 evidenzia come la fiducia cieca nell’output dei modelli LLM rappresenti oggi una vulnerabilità critica. Per contrastare il phantom squatting, è fondamentale che aziende e sviluppatori verifichino sempre manualmente validità e proprietà di ogni URL o dominio suggerito dall’LLM prima di cliccarvi o di integrarlo nei progetti e implementino soluzioni di sicurezza in grado di monitorare le registrazioni di domini sospetti o di recente creazione.
L’adozione degli LLM richiede un cambio di paradigma nella cybersecurity, con l’output generato dalle macchine che non può più essere considerato intrinsecamente sicuro, ma deve essere trattato come una potenziale fonte di rischio da verificare e governare attivamente.


