Deltahedge

Executive summary

Quando un sistema software deve svolgere compiti articolati che richiedono decisioni in sequenza, consultazione di fonti esterne e adattamento al contesto, servono architetture capaci di coordinare molte operazioni in modo autonomo. Questo articolo analizza come i modelli di linguaggio di grandi dimensioni possano essere utilizzati per costruire sistemi che pianificano azioni, consultano banche dati e collaborano tra loro per raggiungere un obiettivo. L'analisi mostra che i sistemi più efficaci combinano capacità di ragionamento strutturato con l'accesso controllato a risorse esterne, ma che aggiungere complessità al sistema si giustifica solo quando il problema lo richiede realmente. Sono inoltre emersi protocolli aperti che consentono a sistemi diversi di comunicare tra loro, sebbene la solidità di questi approcci in contesti operativi reali resti un problema aperto.

Background

Il concetto di agente autonomo in intelligenza artificiale precede di decenni l'avvento dei large language model (LLM). La definizione classica di Russell e Norvig descrive un agente come un'entità che percepisce il proprio ambiente attraverso sensori e agisce su di esso attraverso attuatori [1]. Con l'emergere dei LLM come sistemi capaci di comprendere e generare linguaggio naturale con competenza crescente, la comunità scientifica ha riconosciuto il potenziale di utilizzare questi modelli come nucleo decisionale di agenti software in grado di operare in ambienti digitali complessi [2].

Il passaggio da LLM come sistemi di completamento testuale a LLM come controllori di agenti è stato catalizzato da due sviluppi convergenti nel biennio 2022-2023. Il primo è la dimostrazione che tecniche di prompting strutturato, in particolare il chain-of-thought prompting introdotto da Wei et al. [3], possono elicitare capacità di ragionamento multi-step in modelli sufficientemente grandi. Il secondo è l'introduzione di meccanismi di tool use che consentono al modello di invocare funzioni esterne durante il processo di generazione, superando così i limiti intrinseci della conoscenza parametrica [4, 5].

Il termine "sistema agentico" copre oggi uno spettro ampio di architetture. Anthropic, nella propria guida alla progettazione di agenti, propone una distinzione operativa tra workflow e agent: i workflow sono sistemi in cui più chiamate a LLM sono orchestrate secondo pattern predefiniti, mentre gli agent sono sistemi in cui il modello dirige autonomamente il proprio processo decisionale e l'uso degli strumenti [6]. Questa distinzione è rilevante dal punto di vista progettuale, poiché la scelta tra un'orchestrazione deterministica è una autonoma influenza direttamente l'affidabilità, la predicibilità è il costo computazionale del sistema.

La survey di Wang et al. [2] propone un framework unificato per la costruzione di agenti basati su LLM articolato in tre componenti fondamentali: un modulo di pianificazione (planning), che scompone obiettivi complessi in sotto-obiettivi gestibili; un modulo di memoria, che mantiene informazioni di contesto a breve e lungo termine; è un modulo di azione (action), che include l'invocazione di strumenti esterni e l'interazione con l'ambiente. Il modulo di memoria, in particolare, si articola in memoria a breve termine (il contesto della conversazione corrente) e memoria a lungo termine (conoscenza persistente recuperata da archivi vettoriali o database), e rappresenta un fattore critico per le prestazioni dell'agente in compiti che richiedono continuità operativa su più sessioni. Questa tripartizione offre una lente analitica utile per esaminare le architetture discusse nelle sezioni successive.

Fondamenti: ragionamento e uso di strumenti

Chain-of-thought e ragionamento strutturato

La capacità di un agente di operare efficacemente dipende in modo critico dalla qualità del ragionamento che il modello sottostante è in grado di produrre. Wei et al. [3] hanno dimostrato che fornire al modello esempi di ragionamento intermedio (chain-of-thought) migliora significativamente le prestazioni su compiti di ragionamento aritmetico, simbolico e di senso comune. Il meccanismo è concettualmente semplice: anziché generare direttamente la risposta finale, il modello viene guidato a esplicitare i passaggi logici intermedi, producendo una catena di pensiero che funge da scaffold per il ragionamento.

Questa intuizione è stata estesa in direzioni più sofisticate. Yao et al. [7] hanno introdotto il framework Tree of Thoughts (ToT), che generalizza il chain-of-thought consentendo al modello di esplorare molteplici percorsi di ragionamento in parallelo, valutarli e selezionare i più promettenti. A differenza del chain-of-thought lineare, ToT consente backtracking e ricerca globale nello spazio delle soluzioni. I risultati sperimentali sono significativi: sul benchmark Game of 24, GPT-4 con chain-of-thought standard risolve il 4% dei problemi, mentre con Tree of Thoughts raggiunge il 74% [7]. Questo divario illustra come la struttura del processo di ragionamento, non solo la capacità del modello, determini la qualità delle soluzioni.

Il framework Reflexion, proposto da Shinn et al. [8], introduce un meccanismo complementare: il reinforcement verbale. Dopo ogni tentativo di esecuzione di un compito, l'agente produce una riflessione testuale sull'esito, identifica errori e strategie migliorative, e conserva queste riflessioni in una memoria episodica. Nei tentativi successivi, l'agente utilizza le riflessioni accumulate per evitare errori già commessi. Questo approccio elimina la necessità di aggiornare i pesi del modello attraverso fine-tuning, sostituendo il gradient update con un'auto-critica in linguaggio naturale che viene mantenuta nel contesto [8].

ReAct: la fusione di ragionamento e azione

Il paradigma ReAct (Reasoning and Acting), introdotto da Yao et al. [5], rappresenta un punto di svolta nella progettazione di agenti basati su LLM. L'intuizione centrale è che ragionamento e azione non devono essere processi separati: il modello genera in modo alternato tracce di ragionamento (thought) e azioni concrete (action), dove le tracce di ragionamento guidano la pianificazione è la gestione delle eccezioni, mentre le azioni consentono di interagire con fonti esterne per acquisire informazioni aggiuntive [5].

Su benchmark di question answering multi-hop come HotpotQA, ReAct supera il chain-of-thought puro nel ridurre le hallucination, poiché il modello può verificare le proprie ipotesi consultando fonti esterne anziché affidarsi esclusivamente alla conoscenza parametrica. Su benchmark di decision-making interattivo come ALFWorld, ReAct supera i metodi basati su imitation learning e reinforcement learning con un margine del 34% in termini di success rate, pur utilizzando solo uno o due esempi nel contesto [5]. Questo risultato è particolarmente rilevante perché dimostra che l'integrazione di ragionamento esplicito e azione concreta è più efficace di entrambi gli approcci in isolamento.

Tool use e function calling

Parallelamente allo sviluppo di ReAct, la ricerca sul tool use ha affrontato il problema di come un LLM possa imparare a invocare strumenti esterni in modo autonomo. Schick et al. [4] hanno proposto Toolformer, un approccio in cui il modello apprende in modo auto-supervisionato quando invocare un'API, quali argomenti passare e come integrare i risultati nella generazione successiva. L'aspetto innovativo risiede nel metodo di addestramento: il modello annota autonomamente un corpus con chiamate API, filtra le annotazioni in base alla loro utilità (misurata come riduzione della loss di predizione), e viene riaddestrato sul corpus annotato [4].

Shen et al. [9] hanno esplorato un approccio complementare con HuggingGPT, in cui un LLM funge da controllore che orchestra l'esecuzione di modelli specialisti. Il flusso operativo si articola in quattro fasi: il LLM analizza la richiesta dell'utente e genera un piano di esecuzione con dipendenze tra task; seleziona i modelli più appropriati da un registro di modelli disponibili; coordina l'esecuzione dei task rispettando le dipendenze; e infine sintetizza i risultati in una risposta coerente [9]. Questo pattern di "LLM come controllore" è diventato un archetipo ricorrente nelle architetture agentiche successive.

L'evoluzione industriale del tool use ha portato alla standardizzazione del function calling nei principali provider di LLM. I modelli della famiglia Claude di Anthropic e i modelli GPT di OpenAI espongono interfacce native per la definizione di strumenti tramite schema JSON, consentendo al modello di generare chiamate strutturate a funzioni con validazione dei tipi [10]. Questa standardizzazione ha ridotto significativamente la complessità ingegneristica necessaria per costruire agenti capaci di interagire con sistemi esterni.

Architetture di orchestrazione

La progettazione di un sistema agentico richiede decisioni architetturali che vanno oltre la scelta del modello e degli strumenti. Anthropic [6] identifica cinque pattern di orchestrazione ricorrenti, organizzati per complessità crescente, ciascuno con un diverso profilo di trade-off tra controllabilità, flessibilità e costo computazionale.

Workflow deterministici

I primi tre pattern, prompt chaining, routing e parallelization, costituiscono workflow deterministici in cui il flusso di controllo è predefinito dallo sviluppatore.

Il prompt chaining scompone un compito in una sequenza di chiamate a LLM, dove l'output di ciascuna chiamata alimenta l'input della successiva. Ogni passaggio può includere un gate programmatico che verifica la qualità dell'output prima di procedere. Questo pattern è indicato quando il compito è naturalmente scomponibile in fasi sequenziali e si vuole privilegiare la latenza di ciascun passaggio alla complessità del prompt [6].

Il routing introduce una fase iniziale di classificazione in cui un LLM analizza l'input e lo indirizza verso un sotto-flusso specializzato. Questo pattern è efficace quando gli input possono essere categorizzati in classi con requisiti di elaborazione distinti, ad esempio, il triage di richieste di supporto verso agenti specializzati per tipologia di problema [6].

La parallelization prevede l'esecuzione simultanea di più chiamate a LLM sullo stesso input, con successiva aggregazione dei risultati. Due varianti principali emergono: la sectioning, in cui il compito viene suddiviso in sotto-compiti indipendenti eseguiti in parallelo, è il voting, in cui lo stesso compito viene eseguito più volte e i risultati vengono aggregati per consenso [6].

Pattern agentici

I pattern più sofisticati, orchestrator-workers e evaluator-optimizer, introducono gradi crescenti di autonomia.

Nel pattern orchestrator-workers, un LLM orchestratore analizza il compito, delega sotto-compiti a LLM worker specializzati, e sintetizza i risultati. A differenza della parallelization, l'orchestratore determina dinamicamente quali sotto-compiti generare e come distribuirli, adattando il piano di esecuzione al contesto specifico [6]. Questo pattern è particolarmente indicato per compiti in cui i sotto-compiti non possono essere determinati a priori.

Il pattern evaluator-optimizer implementa un ciclo di raffinamento iterativo: un LLM genera una soluzione, un secondo LLM (o lo stesso con un prompt diverso) la valuta e fornisce feedback, è il processo si ripete fino al raggiungimento di un criterio di qualità. Questo pattern è efficace quando esistono criteri di valutazione chiari è il miglioramento iterativo produce risultati misurabili [6].

Il diagramma seguente sintetizza la tassonomia dei pattern di orchestrazione:

graph TD
    A[Sistemi agentici] --> B[Workflow deterministici]
    A --> C[Pattern agentici]
    B --> D[Prompt chaining]
    B --> E[Routing]
    B --> F[Parallelization]
    C --> G[Orchestrator-workers]
    C --> H[Evaluator-optimizer]
    C --> I[Autonomous agent loop]
    I --> J[Thought → Action → Observation]
    J --> I

Figura 1. Tassonomia dei pattern di orchestrazione per sistemi agentici. I workflow deterministici offrono maggiore controllabilità, i pattern agentici maggiore flessibilità.

Al livello di massima autonomia si colloca l'autonomous agent loop, in cui un singolo LLM opera in un ciclo aperto di ragionamento-azione-osservazione (il pattern ReAct generalizzato) fino al raggiungimento dell'obiettivo o al superamento di un budget di risorse. La raccomandazione operativa che emerge dalla letteratura è inequivocabile: la complessità architetturale deve essere proporzionale alla complessità del compito, e si dovrebbe ricorrere a pattern più autonomi solo quando i pattern deterministici risultano insufficienti [6].

Framework e SDK per sistemi agentici

L'ecosistema dei framework per lo sviluppo di agenti basati su LLM si è consolidato rapidamente nel periodo 2024-2026, con l'emergere di soluzioni che differiscono significativamente nelle astrazioni offerte, nel grado di controllabilità e nel livello di maturità in produzione.

LangGraph

LangGraph, sviluppato da LangChain e rilasciato in versione 1.0 GA nell'ottobre 2025, adotta il paradigma del grafo di stato (StateGraph) come astrazione fondamentale [11]. A differenza delle catene lineari tradizionali, LangGraph modella i flussi agentici come grafi diretti con nodi (azioni, funzioni, punti decisionali) e archi (transizioni di stato), supportando nativamente cicli, branching condizionale e approvazioni human-in-the-loop. Un meccanismo di checkpointing salva automaticamente lo stato dopo ogni esecuzione di nodo, consentendo il ripristino da guasti senza perdita di contesto [11].

Il vantaggio architetturale di LangGraph risiede nella separazione esplicita tra topologia del workflow e logica dei singoli nodi. Il grafo di stato centralizzato mantiene risultati intermedi e metadati, rendendo il sistema ispezionabile e debuggabile. Questa trasparenza ha un costo: la curva di apprendimento è significativamente più ripida rispetto a framework più opinati, è la verbosità del codice aumenta con la complessità del grafo.

OpenAI Agents SDK

L'Agents SDK di OpenAI, rilasciato nel marzo 2025 come evoluzione del progetto sperimentale Swarm, adotta un approccio minimalista centrato su quattro primitive: agent, handoff, guardrail e tool [12]. L'astrazione più caratteristica è l'handoff: un agente può trasferire il controllo a un altro agente in modo esplicito, trasportando il contesto della conversazione attraverso la transizione. Gli handoff sono rappresentati come tool dal punto di vista del modello, il che significa che la decisione di delegare avviene attraverso lo stesso meccanismo di selezione degli strumenti [12].

L'SDK supporta due pattern di orchestrazione multi-agent: l'handoff collaboration, in cui agenti peer si passano il controllo in base alla propria specializzazione, e l'agent-as-tool, in cui un agente orchestratore invoca agenti subordinati come se fossero strumenti, mantenendo il controllo della conversazione [12]. La semplicità concettuale dell'SDK ne accelera l'adozione per prototipi e applicazioni con flussi relativamente lineari, ma limita la capacità di modellare workflow complessi con cicli e stati condivisi.

Claude Agent SDK

L'SDK di Anthropic per la costruzione di agenti adotta un approccio tool-use-first in cui un agente è definito come un modello Claude equipaggiato con un insieme di strumenti, inclusa la possibilità di invocare altri agenti come strumenti [10]. L'architettura è deliberatamente semplice: un ciclo agentico riceve un prompt, invoca strumenti secondo necessità (inclusi sotto-agenti), e restituisce una risposta strutturata. Il focus progettuale è sul controllo del ciclo di vita dell'agente e sulla safety, con meccanismi nativi per limitare le azioni consentite e monitorare il comportamento del modello in produzione [10].

CrewAI

CrewAI adotta una metafora organizzativa in cui agenti con ruoli definiti (role-based agents) collaborano all'interno di "crew" con processi di esecuzione configurabili [13]. Ogni agente è caratterizzato da un ruolo, un obiettivo è un backstory che ne guidano il comportamento. L'orchestrazione avviene attraverso tre modalità di processo: sequenziale, gerarchica e consensuale. CrewAI ha raggiunto una significativa adozione comunitaria (oltre 44.600 stelle GitHub a marzo 2026) e ha integrato nativamente il supporto per i protocolli MCP e A2A [13].

Il trade-off principale di CrewAI riguarda la tensione tra espressività della metafora role-based e controllabilità fine-grained. L'astrazione per ruoli facilita la progettazione concettuale di sistemi multi-agent, ma può risultare limitante quando il comportamento desiderato non si mappa naturalmente su ruoli organizzativi.

Analisi comparativa

La scelta tra framework riflette un trade-off fondamentale tra flessibilità architetturale e semplicità di adozione. Il seguente schema riassume le caratteristiche principali:

Framework	Astrazione centrale	Orchestrazione	Punto di forza	Limitazione principale
LangGraph	StateGraph	Grafo diretto con cicli	Controllabilità e persistenza	Complessità e verbosità
OpenAI Agents SDK	Handoff	Trasferimento esplicito	Semplicità concettuale	Workflow complessi limitati
Claude Agent SDK	Tool-use loop	Agenti come strumenti	Safety e controllo lifecycle	Ecosistema più giovane
CrewAI	Role-based crew	Processi configurabili	Prototipazione rapida	Controllabilità fine-grained

La raccomandazione emergente dalla letteratura è congruente con il principio di parsimonia architetturale: iniziare con il framework che offre le astrazioni più vicine al problema specifico, e aumentare la complessità solo quando i requisiti lo giustificano [6].

Sistemi multi-agent

Fondamenti teorici

L'idea di far collaborare più agenti basati su LLM su un compito comune ha radici nel lavoro pionieristico di Li et al. [14], che con il framework CAMEL hanno introdotto il paradigma del role-playing comunicativo. In CAMEL, due agenti assumono ruoli complementari (ad esempio, un "programmatore" è un "project manager") e collaborano attraverso il dialogo per risolvere un compito, guidati da inception prompting che mantiene la coerenza con le intenzioni dell'utente. L'analisi degli autori evidenzia sfide ricorrenti nei sistemi multi-agent: deviazione della conversazione dall'obiettivo, inversione dei ruoli, e difficoltà nel determinare condizioni di terminazione [14].

Wu et al. [15] hanno proposto AutoGen, un framework che generalizza l'interazione multi-agent attraverso il concetto di agenti conversabili (conversable agents). Ogni agente in AutoGen è personalizzabile e può operare in modalità che combinano LLM, input umano e strumenti. Il framework supporta pattern di conversazione flessibili, dalla coppia di agenti alla collaborazione di gruppo con topologie di comunicazione configurabili [15]. I risultati sperimentali dimostrano l'efficacia dell'approccio su domini eterogenei: matematica, coding, question answering, ricerca operativa e decision-making.

Pattern di collaborazione multi-agent

L'analisi della letteratura recente consente di identificare tre pattern ricorrenti di collaborazione tra agenti.

Il debate pattern prevede che più agenti generino risposte indipendenti allo stesso problema e poi le discutano iterativamente fino a raggiungere un consenso. Questo approccio sfrutta la diversità delle risposte iniziali per migliorare la qualità della soluzione finale, analogamente al principio del comitato di esperti (ensemble) nell'apprendimento automatico. La ricerca presentata a NeurIPS 2024 sul framework COPPER ha dimostrato che l'aggiunta di meccanismi di self-reflection migliora la qualità della collaborazione tra agenti, riducendo gli errori di ragionamento attraverso un processo di revisione incrociata [16].

Il hierarchical delegation pattern organizza gli agenti in una gerarchia in cui un agente orchestratore delega sotto-compiti ad agenti specialisti. Questo pattern, esemplificato da HuggingGPT [9] e ripreso nel design di Google ADK, è particolarmente efficace quando i sotto-compiti richiedono competenze eterogenee e le dipendenze tra task sono complesse.

Il pipeline pattern dispone gli agenti in sequenza, dove ciascun agente elabora e arricchisce l'output dell'agente precedente prima di passarlo al successivo. Il framework Chain of Agents [17], presentato a NeurIPS 2024, implementa questo pattern per compiti su testi lunghi: agenti worker elaborano sequenzialmente porzioni di testo, è un agente manager sintetizza i contributi in un output finale.

Limiti dei sistemi multi-agent

È necessario un caveat critico sull'efficacia dei sistemi multi-agent. La ricerca recente indica che l'aggiunta di agenti non produce automaticamente miglioramenti proporzionali. L'analisi di NeurIPS 2025 sull'evolving orchestration [18] mostra che l'orchestrazione statica degli agenti è spesso subottimale, e che un orchestratore addestrato con reinforcement learning per adattare dinamicamente la sequenza è la priorità degli agenti produce risultati significativamente migliori. Questo suggerisce che il valore aggiunto dei sistemi multi-agent risiede non nel numero di agenti, ma nella qualità del protocollo di coordinamento.

Un problema aperto riguarda il costo computazionale. Ogni agente aggiuntivo implica almeno una chiamata aggiuntiva al modello, con conseguente aumento di latenza, costo e probabilità di errore. Per compiti in cui un singolo agente con strumenti adeguati può raggiungere risultati comparabili, la complessità di un sistema multi-agent non è giustificata.

Protocolli di interoperabilità

Model Context Protocol (MCP)

L'interoperabilità tra agenti e strumenti esterni ha trovato una prima risposta strutturale nel Model Context Protocol (MCP), rilasciato da Anthropic come standard aperto nel novembre 2024 [19]. MCP definisce un protocollo bidirezionale per connettere applicazioni basate su LLM a sorgenti dati e strumenti esterni attraverso un'architettura client-server. I server MCP espongono risorse (dati), strumenti (funzioni invocabili) e prompt (template di interazione); i client MCP (tipicamente agenti o applicazioni) si connettono ai server per accedere a queste capacità.

L'adozione di MCP è stata rapida e trasversale. Nel marzo 2025, OpenAI ha adottato MCP nell'Agents SDK, nella Responses API e nel client desktop ChatGPT. A dicembre 2025, Anthropic ha donato MCP alla Agentic AI Foundation (AAIF) sotto la Linux Foundation, consolidandone lo status di standard condiviso [19]. L'adozione è stata ampia e trasversale, con un ecosistema di server MCP in rapida crescita che copre database, API, servizi cloud e strumenti di sviluppo.

Agent-to-Agent Protocol (A2A)

Mentre MCP risolve il problema dell'interazione tra un agente e i suoi strumenti, il protocollo Agent-to-Agent (A2A) introdotto da Google nell'aprile 2025 affronta il problema complementare della comunicazione tra agenti eterogenei [20]. A2A consente ad agenti costruiti con framework e provider diversi di scoprire le reciproche capacità, negoziare le modalità di interazione (testo, file, dati strutturati), gestire task collaborativi e scambiare informazioni in modo sicuro, senza necessità di accedere allo stato interno, alla memoria o agli strumenti dell'altro agente [20].

A2A è stato progettato come complementare a MCP: MCP gestisce la relazione agente-strumento, A2A la relazione agente-agente. Google ha contribuito A2A alla Linux Foundation nel giugno 2025, è il protocollo ha raggiunto la versione 0.3 con supporto per gRPC e SDK in Python [20].

La convergenza di MCP e A2A prefigura un'architettura a strati per sistemi agentici complessi:

graph LR
    subgraph "Agente A"
        A1[LLM + Planning] --> A2[MCP Client]
    end
    subgraph "Agente B"
        B1[LLM + Planning] --> B2[MCP Client]
    end
    subgraph "Strumenti"
        T1[MCP Server: Database]
        T2[MCP Server: API esterna]
    end
    A2 --> T1
    A2 --> T2
    B2 --> T1
    A1 <-->|A2A Protocol| B1

Figura 2. Architettura a strati: MCP gestisce la comunicazione agente-strumento, A2A la comunicazione agente-agente.

Limiti e problemi aperti

Affidabilità e controllabilità

Il limite più significativo dei sistemi agentici basati su LLM riguarda l'affidabilità. Ogni passaggio del ciclo agentico introduce una probabilità di errore, nella comprensione dell'istruzione, nella selezione dello strumento, nell'interpretazione dell'output, e questi errori si compongono in modo moltiplicativo lungo catene di azioni multiple [2]. Un agente che opera con una precisione del 95% per singola azione raggiunge solo il 77% di accuratezza dopo cinque azioni sequenziali è il 60% dopo dieci. Questa dinamica rende critica la progettazione di meccanismi di verifica intermedia, checkpoint e rollback.

La controllabilità è un problema correlato. In un workflow deterministico, il comportamento del sistema è prevedibile e ispezionabile. In un agente autonomo, il percorso di esecuzione dipende dalle decisioni del modello, che possono variare tra esecuzioni identiche a causa della stocasticità del campionamento. Questo introduce un elemento di non-determinismo che complica il testing, il debugging è la certificazione del sistema.

Costi computazionali e latenza

I sistemi agentici sono intrinsecamente più costosi di una singola chiamata a un LLM. Un agente che esegue un ciclo di 10 iterazioni con strumenti genera un volume di token 10-50 volte superiore a una singola interazione. In configurazioni multi-agent, questo fattore si moltiplica ulteriormente. La latenza end-to-end cresce linearmente con il numero di passaggi sequenziali, rendendo critica l'ottimizzazione del parallelismo è la minimizzazione delle interazioni non necessarie.

Valutazione e benchmark

La valutazione dei sistemi agentici rimane un problema metodologicamente aperto. I benchmark esistenti, come SWE-bench per il coding, WebArena per la navigazione web, o GAIA per compiti generalisti, catturano aspetti specifici delle capacità agentiche ma non offrono una valutazione olistica che tenga conto simultaneamente di accuratezza, efficienza, costo e safety [2]. La survey di Wang et al. [2] identifica la mancanza di framework di valutazione standardizzati come uno degli ostacoli principali al progresso del campo.

Safety e allineamento

Quando un agente dispone di strumenti che producono effetti nel mondo reale, esecuzione di codice, invocazione di API, modifica di database, il rischio di azioni indesiderate diventa concreto. La ricerca sull'allineamento degli agenti è ancora in una fase iniziale rispetto all'allineamento dei modelli generativi. Meccanismi di sandboxing, approvazione umana per azioni critiche (human-in-the-loop) e vincoli espliciti sulle azioni consentite rappresentano le strategie difensive attualmente adottate [6, 10], ma una teoria formale della safety agentica resta da sviluppare.

Implicazioni pratiche

L'analisi condotta nelle sezioni precedenti converge su alcune raccomandazioni operative per la progettazione di sistemi agentici in contesti di produzione.

Privilegiare la semplicità architetturale. Il principio cardine è iniziare con l'architettura più semplice che soddisfa i requisiti. Un singolo LLM con strumenti ben progettati e prompt engineering accurato risolve una porzione significativa dei casi d'uso. L'introduzione di pattern orchestrativi più complessi, e a maggior ragione di sistemi multi-agent, deve essere giustificata da requisiti specifici che le soluzioni più semplici non riescono a soddisfare [6].

Investire nella progettazione degli strumenti. La qualità degli strumenti a disposizione dell'agente determina il limite superiore delle sue prestazioni più di quanto lo faccia la scelta del modello o del framework. Strumenti con interfacce chiare, documentazione esplicita nei prompt, gestione degli errori robusta e output strutturati riducono la probabilità di errore a ogni interazione.

Implementare meccanismi di verifica intermedia. In workflow multi-step, l'inserimento di gate programmatici che verificano l'output di ciascun passaggio prima di procedere al successivo è una delle strategie più efficaci per mitigare la composizione degli errori. Questo approccio corrisponde al pattern di prompt chaining con validation gate descritto da Anthropic [6].

Adottare standard aperti per l'interoperabilità. L'adozione di MCP per l'integrazione di strumenti e di A2A per la comunicazione tra agenti riduce il lock-in verso specifici provider e facilita l'evoluzione incrementale dell'architettura. La maturità di questi protocolli è in crescita, con entrambi ora sotto la governance della Linux Foundation [19, 20].

Pianificare per l'osservabilità. Un sistema agentico in produzione richiede logging strutturato di ogni passaggio del ciclo agentico: prompt inviati, strumenti invocati, output ricevuti, decisioni prese. Senza osservabilità, il debugging di comportamenti anomali diventa impraticabile.

Riferimenti

[1] S. Russell, P. Norvig, Artificial Intelligence: A Modern Approach, 4th ed., Pearson, 2020.

[2] L. Wang et al., "A Survey on Large Language Model based Autonomous Agents," Frontiers of Computer Science, 2024. https://arxiv.org/abs/2308.11432

[3] J. Wei et al., "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models," in Proc. NeurIPS, 2022. https://arxiv.org/abs/2201.11903

[4] T. Schick et al., "Toolformer: Language Models Can Teach Themselves to Use Tools," in Proc. NeurIPS, 2023. https://arxiv.org/abs/2302.04761

[5] S. Yao et al., "ReAct: Synergizing Reasoning and Acting in Language Models," in Proc. ICLR, 2023. https://arxiv.org/abs/2210.03629

[6] Anthropic, "Building Effective Agents," 2024. https://www.anthropic.com/research/building-effective-agents

[7] S. Yao et al., "Tree of Thoughts: Deliberate Problem Solving with Large Language Models," in Proc. NeurIPS, 2023. https://arxiv.org/abs/2305.10601

[8] N. Shinn et al., "Reflexion: Language Agents with Verbal Reinforcement Learning," in Proc. NeurIPS, 2023. https://arxiv.org/abs/2303.11366

[9] Y. Shen et al., "HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face," in Proc. NeurIPS, 2023. https://arxiv.org/abs/2303.17580

[10] Anthropic, "Tool Use with Claude," Claude API Documentation, 2025. https://platform.claude.com/docs/en/agents-and-tools/tool-use/overview

[11] LangChain, "LangGraph: Agent Orchestration Framework," 2025. https://langchain-ai.github.io/langgraph/

[12] OpenAI, "Agent Orchestration — OpenAI Agents SDK," 2025. https://openai.github.io/openai-agents-python/multi_agent/

[13] CrewAI, "CrewAI Documentation," 2025. https://docs.crewai.com

[14] G. Li et al., "CAMEL: Communicative Agents for 'Mind' Exploration of Large Language Model Society," in Proc. NeurIPS, 2023. https://arxiv.org/abs/2303.17760

[15] Q. Wu et al., "AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation," arXiv:2308.08155, 2023. https://arxiv.org/abs/2308.08155

[16] Z. Li et al., "Reflective Multi-Agent Collaboration based on Large Language Models," in Proc. NeurIPS, 2024. https://neurips.cc/virtual/2024/poster/93147

[17] Y. Zhang et al., "Chain of Agents: Large Language Models Collaborating on Long-Context Tasks," in Proc. NeurIPS, 2024. https://openreview.net/forum?id=LuCLf4BJsr

[18] Y. Chen et al., "Multi-Agent Collaboration via Evolving Orchestration," in Proc. NeurIPS, 2025. https://openreview.net/forum?id=L0xZPXT3le

[19] Anthropic, "Introducing the Model Context Protocol," 2024. https://www.anthropic.com/news/model-context-protocol

[20] Google, "Announcing the Agent2Agent Protocol (A2A)," Google Developers Blog, 2025. https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/

LLM Orchestration & Agents