Question 1

Facciamo già un penetration test ogni anno: questo è un doppione?

Accepted Answer

No. Il penetration test tradizionale verifica infrastruttura e applicazioni dal comportamento prevedibile: rete, server, codice. Qui si testa il comportamento di un modello non deterministico e ciò a cui l'applicazione gli permette di accedere: prompt injection, jailbreak, esfiltrazione di dati attraverso le risposte. Sono superfici che le metodologie classiche non contemplano: i due test si completano, non si sovrappongono.

Question 2

Il modello è di un grande fornitore: la sicurezza non è già inclusa?

Accepted Answer

Il fornitore protegge il modello di base e la sua infrastruttura. Tutto ciò che ci costruisci intorno — system prompt, documenti indicizzati, permessi, strumenti collegati, integrazioni — è responsabilità di chi realizza l'applicazione, ed è lì che nasce la maggior parte delle vulnerabilità reali: un modello sicuro dentro un'applicazione che gli concede troppo resta un sistema attaccabile.

Question 3

Il test può danneggiare il sistema o esporre dati reali?

Accepted Answer

Le regole d'ingaggio si definiscono per iscritto prima di iniziare: perimetro, scenari ammessi, gestione dei dati. Quando possibile si lavora in un ambiente di staging con dati sintetici; in produzione solo con finestre e limiti concordati. Le evidenze raccolte restano riservate e non escono dal perimetro del test.

Question 4

Quanto dura e quanto costa un assessment di AI security?

Accepted Answer

Dipende dal perimetro: numero di applicazioni, presenza di agenti e integrazioni, scenari da coprire, ambiente di test disponibile. Sono gli stessi fattori che determinano sia la durata sia il costo. Per questo si parte da uno scoping che fissa obiettivi, tempi e preventivo prima dell'avvio: la presenza di agenti e l'assenza di un ambiente di staging sono ciò che incide di più.

Question 5

Ogni quanto va ripetuto il test?

Accepted Answer

A ogni cambio significativo: nuovo modello o fornitore, modifiche al system prompt, nuove integrazioni o strumenti collegati, nuove fonti di dati indicizzate. Ognuno di questi interventi riapre la superficie d'attacco. L'assessment iniziale produce una baseline su cui impostare regression test ricorrenti, mirati su ciò che è cambiato invece di ripartire da zero.

Question 6

Il report vale per l'AI Act o per i vendor assessment dei nostri clienti?

Accepted Answer

Non è una certificazione di conformità, ma è un'evidenza tecnica utile in entrambi i casi. I risultati sono mappati sulla OWASP Top 10 for LLM Applications (ed. 2025), riferimento internazionale riconosciuto: il report è spendibile nelle due diligence dei clienti enterprise e come documentazione tecnica a supporto della gestione del rischio dei sistemi AI, da inquadrare nel percorso di conformità insieme al servizio Compliance AI Act di CyberQuake.

AI security

Dove si rompono davvero le applicazioni AI

Come si testa un sistema che non risponde mai allo stesso modo

Cosa facciamo

Cosa ottieni