In ogni azienda c’è uno scheletro operativo fatto di lavoro esecutivo: smistare la posta e la PEC, riconciliare ordini, fatture e DDT, aggiornare il CRM dalle caselle condivise, compilare ogni settimana lo stesso report da tre gestionali. È lavoro necessario, ma non è il motivo per cui hai messo insieme la tua squadra. Ricostruiamo quello scheletro pezzo per pezzo, in agenti AI che eseguono sotto supervisione umana: il team passa dall’eseguire al decidere, e il tempo torna al lavoro che richiede giudizio e responsabilità.
Un agente AI non è uno script
Le automazioni a regole — RPA, workflow, integrazioni — eseguono sempre lo stesso percorso e si fermano, o sbagliano, alla prima eccezione. Un agente interpreta il contesto: legge la richiesta scritta male e gestisce il caso che non rientra nello schema. Dove non è progettato per arrivare, però, non è una sua dote nativa a fermarlo: sono i confini e i controlli che abbiamo definito a bloccarlo e a passare la mano a una persona. È questa architettura che lo rende adatto a un lavoro dove le eccezioni sono la regola.
Per ogni agente definiamo tre livelli di autonomia: cosa esegue da solo, cosa richiede approvazione umana, cosa resta in sola lettura. Pagamenti, comunicazioni verso l’esterno e modifiche alle anagrafiche stanno nel secondo livello, sempre. I livelli si rivedono con le metriche alla mano, non a sensazione, e le persone vengono accompagnate nel nuovo ruolo: supervisionare è un mestiere diverso dall’eseguire.
Supervisione per progetto, non per promessa
Su CyberQuake il controllo umano non è uno slogan: ogni agente nasce con permessi minimi sui sistemi a cui accede, punti di approvazione definiti nel design e un audit log che registra azione, input, esito e chi ha approvato. «AI sotto controllo umano» oggi lo scrivono tutti — noi lo progettiamo. Quando un caso esce dal perimetro, l’azione si blocca e passa in escalation a una persona, con il log a ricostruire ogni passaggio.
C’è anche una ragione di sicurezza. Un agente con accesso a posta, gestionale e documenti è una superficie d’attacco: prompt injection indiretta, abuso degli strumenti collegati, esfiltrazione di dati. Per questo gli agenti nascono con l’esperienza offensiva del nostro servizio di AI security, fatto di chi questi sistemi li attacca per mestiere, e le vie di abuso si verificano prima della messa in produzione. Quando trattano dati personali, l’inquadramento rispetto al GDPR e all’AI Act (Reg. UE 2024/1689) fa parte del progetto: per gli agenti che incidono su decisioni sulle persone si verifica quali obblighi si applichino, a partire dalla classe di rischio.
Cosa facciamo
- Mappiamo i processi operativi e separiamo l’esecuzione pura dal giudizio umano
- Progettiamo la rete di agenti AI: compiti, confini, livelli di autonomia e gate di approvazione — chi fa cosa, e chi ferma chi
- Implementiamo sugli strumenti che usi già — gestionale, CRM, posta e PEC, documenti — via API e automazioni, con permessi minimi
- Verifichiamo le vie di abuso dell’agente — prompt injection, uso improprio degli strumenti collegati — prima della messa in produzione
- Registriamo ogni azione nell’audit log — input, esito, chi ha approvato — per ricostruire e per dimostrare
- Misuriamo contro la baseline rilevata prima dell’avvio: ore recuperate, tasso di escalation, rilavorazioni, tempi di attraversamento
- Estendiamo per gradi: un processo alla volta, consolidando prima di allargare
Cosa ottieni
- La mappa dei processi automatizzabili, con la stima del tempo recuperabile e l’ordine di priorità
- Agenti AI in produzione — non demo — con audit log e punti di controllo umano definiti
- Metriche d’impatto riviste periodicamente, per decidere dove estendere e dove fermarsi
- Documentazione e runbook operativo, perché gli agenti restino tuoi: l’estensione è una scelta guidata dai numeri, non un abbonamento
La cautela non è di maniera: Gartner prevede che oltre il 40% dei progetti di agentic AI sarà cancellato entro fine 2027, per costi crescenti, valore poco chiaro o controlli del rischio inadeguati (previsione di giugno 2025). Si parte da un perimetro chiaro proprio per restare fuori da quella statistica, e si estende come si costruisce in zona sismica: un piano alla volta, collaudando prima di salire. Se i processi non sono ancora digitalizzati, il punto di partenza onesto è l’integrazione AI, non un agente. Se quello scheletro lo riconosci, raccontaci il processo più ripetitivo della tua operatività: costruiamo da lì il primo agente, e lasciamo che siano le metriche a giustificare il secondo.
// domande frequenti
In cosa un agente AI è diverso da un'automazione RPA o da un workflow?
Un'automazione a regole segue un percorso fisso: alla prima eccezione si blocca o produce un errore. Un agente AI interpreta il contesto — legge richieste scritte in modi diversi e gestisce la variabilità del lavoro reale — mentre i confini e i controlli definiti nel progetto lo fermano dove non deve arrivare. Per processi stabili e senza eccezioni l'automazione classica resta spesso più economica: l'agente serve dove la realtà non rispetta lo schema.
Cosa succede se un agente sbaglia?
Il danno possibile è limitato per architettura: l'agente opera con permessi minimi e le azioni critiche — pagamenti, comunicazioni verso l'esterno, modifiche alle anagrafiche — richiedono approvazione umana. I casi fuori perimetro vengono fermati dai controlli e passati a una persona, e ogni azione finisce in un audit log che ricostruisce input, esito e approvazioni. Il primo processo, inoltre, si sceglie anche per tenere basso e misurabile il costo di un eventuale errore.
Chi è responsabile delle azioni di un agente AI?
La responsabilità resta dell'azienda che lo usa: nessun fornitore può sollevartene. È per questo che CyberQuake progetta ogni agente con confini espliciti, permessi minimi e punti di approvazione definiti per progetto, non lasciati alla buona volontà. Consegna inoltre un log completo delle azioni: se serve dimostrare chi ha fatto cosa, la ricostruzione è documentale, non affidata alla memoria.
Dove girano gli agenti e dove finiscono i nostri dati?
I dati restano dove sono già: gli agenti lavorano sugli strumenti in uso — gestionale, CRM, posta, documenti — con permessi minimi, e non creano una copia esterna del patrimonio informativo. L'architettura si sceglie sui vincoli di riservatezza, e la scelta del modello conta quanto l'hosting: dove i dati sono sensibili valutiamo modelli con trattamento confinato in UE o eseguiti on-premise, perché il dato non lasci il perimetro solo per essere elaborato. Tutto in conformità al GDPR.
Quanto tempo serve per avere il primo agente in produzione?
Dipende da tre fattori: la complessità del processo scelto, i sistemi da integrare e i punti di approvazione da progettare. Per questo non promettiamo una data uguale per tutti: la fissiamo insieme dopo aver circoscritto il primo perimetro e mappato la baseline, così il risultato si confronta con dati e non con impressioni. Il perimetro circoscritto è proprio ciò che permette di arrivare in produzione presto, invece di aprire un cantiere a tempo indeterminato.
Dopo il progetto restiamo legati al fornitore?
No, per scelta di progetto. Con gli agenti vengono consegnati documentazione e runbook operativo: cosa fa ciascun agente, con quali permessi, come si interviene quando serve. Il team interno viene formato per la supervisione quotidiana e, dove le competenze ci sono, per la manutenzione. L'estensione a nuovi processi è una decisione guidata dalle metriche, non un canone perpetuo.