Executive summary
I grafi di conoscenza sono strutture che organizzano informazioni del mondo reale come reti di entità collegate da relazioni tipizzate, consentendo alle macchine di navigare, interrogare e ragionare su basi di conoscenza complesse. Questa tecnologia trova applicazione concreta nell'arricchimento automatico dei dati, nei sistemi di raccomandazione e nel miglioramento della qualità delle risposte prodotte da sistemi di intelligenza artificiale. L'analisi che segue esamina i metodi per costruire e interrogare grafi di conoscenza, dalle tecniche di rappresentazione matematica ai sistemi che estraggono automaticamente conoscenza strutturata dal testo, e mostra come i progressi più recenti stiano convergendo verso modelli capaci di ragionare su grafi mai visti prima, riducendo significativamente gli errori dei sistemi di intelligenza artificiale in compiti di dominio.
Background
La sfida centrale dei knowledge graph non è mai stata la rappresentazione in sé, codificare fatti come triple (soggetto, predicato, oggetto) in un grafo diretto e tipizzato è un problema formalmente risolto da decenni, dalle reti semantiche degli anni Settanta agli standard W3C odierni. La sfida è ragionare su questa conoscenza: inferire relazioni implicite, completare informazione mancante, e integrare fonti eterogenee in una struttura coerente e interrogabile. Knowledge graph aperti su larga scala come Freebase [1] e DBpedia [2] hanno dimostrato che la conoscenza strutturata a scala abilita applicazioni che spaziano dal question answering ai sistemi di raccomandazione. Il fondamento formale risiede nel Resource Description Framework (RDF), standardizzato dal W3C [3], che modella la conoscenza come triple, ma i knowledge graph moderni si articolano in due paradigmi, RDF e property graph, ciascuno con trade-off distinti tra espressività, scalabilità e interoperabilità. Una distinzione critica attraversa entrambi i paradigmi: la closed-world assumption (CWA), in cui le triple assenti sono considerate false, contrapposta alla open-world assumption (OWA), in cui l'assenza indica semplicemente conoscenza mancante. Questa distinzione è determinante per la valutazione dei metodi di link prediction e per il design di sistemi che integrano fonti esterne.
Il campo ha registrato un'accelerazione significativa a partire dal 2020, con la convergenza di tre linee di ricerca: knowledge graph embedding per il link prediction, graph neural network per il reasoning relazionale, e più recentemente l'integrazione con large language model. Una survey pubblicata su IEEE Transactions on Neural Networks and Learning Systems nel 2024 [4] traccia la progressione dello stato dell'arte sul benchmark FB15k-237, con il Mean Reciprocal Rank (MRR) passato da 0.241 (TransE, 2013) a 0.491 con metodi basati su transformer, evidenziando sia i progressi sia i limiti degli approcci attuali.
Architettura e modelli di rappresentazione
Due paradigmi dominano la modellazione di knowledge graph: il modello RDF e il property graph. La scelta tra i due ha implicazioni architetturali profonde che influenzano query language, scalabilità, interoperabilità e capacità inferenziali.
Il modello RDF [3] rappresenta la conoscenza come insiemi di triple (soggetto, predicato, oggetto), dove ogni elemento è identificato da un URI (Uniform Resource Identifier). Questa struttura abilita il linking tra knowledge graph eterogenei attraverso la condivisione di URI ed è alla base del Linked Open Data cloud. Il Web Ontology Language (OWL) estende RDF con una semantica formale basata su description logic, consentendo reasoning deduttivo: inferire nuove triple da quelle esistenti attraverso sussunzione, disgiunzione e restrizioni di cardinalità. Il linguaggio di query standard è SPARQL [5], che supporta pattern matching su grafi, aggregazioni e query federate su endpoint distribuiti. SHACL (Shapes Constraint Language) completa lo stack fornendo validazione strutturale e constraint checking sui grafi RDF.
Il modello property graph, reso popolare da Neo4j e adottato da database come Amazon Neptune e TigerGraph, rappresenta nodi e archi come entità di prima classe con proprietà chiave-valore associate. A differenza di RDF, le relazioni stesse possono portare attributi (peso, timestamp, confidenza), semplificando la modellazione di metadati relazionali senza ricorrere a reificazione. Il linguaggio di query Cypher, standardizzato come GQL da ISO nel 2024, offre una sintassi dichiarativa ottimizzata per il pattern matching su grafi, la cui sintassi dichiarativa è stata progettata per risultare familiare a sviluppatori con background SQL.
La scelta tra i due paradigmi dipende dal contesto applicativo. RDF è preferibile quando l'interoperabilità tra fonti eterogenee e il reasoning ontologico sono requisiti centrali, casi tipici in ambito biomedico, finanziario e nella costruzione di knowledge graph enterprise che integrano fonti esterne. Il property graph è più adatto quando la priorità è la performance in query di attraversamento locale, la semplicità di modellazione e l'integrazione con pipeline applicative. In scenari di data enrichment, dove si combinano knowledge graph interni con fonti esterne come Wikidata [6] o DBpedia [2], architetture ibride che espongono un property graph applicativo con mapping verso RDF per l'interoperabilità rappresentano un compromesso pratico diffuso.
Knowledge graph embedding e link prediction
Il link prediction, prevedere relazioni mancanti tra entità in un knowledge graph, è il task fondamentale che ha guidato lo sviluppo dei metodi di knowledge graph embedding (KGE). L'idea centrale è rappresentare entità e relazioni come vettori in uno spazio continuo a bassa dimensionalità, dove la struttura geometrica dello spazio codifica la plausibilità delle triple.
TransE [7] ha introdotto il paradigma traslazionale: dato un triplo $(h, r, t)$, l'embedding dell'entità head $h$ sommato all'embedding della relazione $r$ deve approssimare l'embedding dell'entità tail $t$, ovvero $\mathbf{h} + \mathbf{r} \approx \mathbf{t}$. La semplicità del modello, lineare, con un solo vettore per relazione, lo rende efficiente su grafi con milioni di entità, ma lo limita nella modellazione di relazioni 1-a-N, N-a-1 e N-a-N, dove entità diverse dovrebbero produrre embedding identici. TransH [8] ha affrontato questo limite proiettando gli embedding su iperpiani specifici per relazione prima della traslazione, migliorando il Hits@10 su FB15k da 34.9% a 58.5%. È opportuno notare che FB15k è stato successivamente sostituito da FB15k-237 dopo la scoperta di data leakage dovuto a triple inverse presenti sia nel training che nel test set, per cui i risultati su FB15k tendono a sovrastimare le performance reali dei modelli.
RotatE [9] ha ridefinito le relazioni come rotazioni nello spazio complesso, modellando pattern relazionali fondamentali, simmetria, antisimmetria, inversione e composizione, che i modelli traslazionali non catturano. Ogni relazione è rappresentata come un vettore di numeri complessi con modulo unitario, e il triplo è plausibile quando $\mathbf{t} \approx \mathbf{h} \circ \mathbf{r}$, dove $\circ$ è il prodotto element-wise di Hadamard. Su WN18RR, RotatE ha raggiunto un MRR di 0.476, superando TransE (0.226) con un margine significativo.
La progressione degli approcci KGE ha seguito una traiettoria dalla geometria euclidea verso spazi più espressivi. Modelli bilineari come DistMult e ComplEx catturano interazioni moltiplicative tra embedding; modelli iperbolici come MuRP e AttH sfruttano la geometria iperbolica per codificare strutture gerarchiche presenti in molti knowledge graph reali. La survey di Pan et al. [4] documenta la progressione del MRR su FB15k-237 da 0.241 (TransE) a 0.491 con metodi recenti che integrano informazione testuale tramite language model pre-addestrati.
Il contributo più recente in questa direzione è KG-FIT [10], presentato a NeurIPS 2024, che introduce un framework a due stadi: clustering gerarchico guidato da LLM per catturare la struttura semantica delle entità, seguito da fine-tuning degli embedding che incorpora sia la gerarchia sia le rappresentazioni testuali. I risultati mostrano un miglioramento del 14.4% nel Hits@10 su FB15k-237 e del 13.5% su YAGO3-10 rispetto ai migliori metodi precedenti basati su pre-trained language model, senza fine-tuning del LLM, i cui pesi rimangono congelati durante l'intero processo di addestramento degli embedding KGE.
Sul piano degli strumenti, PyKEEN [11] è la libreria di riferimento per la ricerca su KGE, con implementazioni di oltre 40 modelli di embedding, 37 benchmark dataset integrati e pipeline complete di training e valutazione. Per applicazioni su scala industriale, knowledge graph con centinaia di milioni di triple, DGL-KE offre training distribuito multi-GPU ottimizzato per TransE, DistMult, ComplEx e RotatE.
Graph neural network su knowledge graph
Le graph neural network (GNN) estendono il paradigma degli embedding statici introducendo aggregazione locale di informazione strutturale: l'embedding di un'entità è calcolato come funzione dei suoi vicini nel grafo, consentendo di catturare pattern topologici multi-hop che i metodi KGE point-wise non modellano.
R-GCN (Relational Graph Convolutional Network) [12] è stata la prima architettura GNN progettata specificamente per grafi multi-relazionali. Il modello utilizza matrici di pesi specifiche per tipo di relazione nella fase di message passing, con due strategie di regolarizzazione per gestire l'esplosione dei parametri: basis decomposition, che esprime ogni matrice relazionale come combinazione lineare di un insieme ridotto di matrici base, e block-diagonal decomposition, che impone una struttura sparsa. Su FB15k-237, R-GCN ha raggiunto un MRR di 0.248 per il link prediction e un'accuratezza del 73.23% per la classificazione di entità su AIFB (un dataset di piccole dimensioni con 176 istanze di training, parte della suite di benchmark per entity classification su knowledge graph). Questi risultati hanno stabilito il primo riferimento per l'applicazione di GNN a grafi multi-relazionali.
CompGCN [13] ha generalizzato R-GCN proponendo un framework unificato che incorpora le rappresentazioni delle relazioni direttamente nel meccanismo di message passing. Invece di matrici di pesi per relazione, CompGCN compone gli embedding di entità e relazione tramite operazioni di composizione, sottrazione, moltiplicazione o circular correlation, prima dell'aggregazione. Questo approccio riduce drasticamente il numero di parametri (una matrice di pesi condivisa per tutte le relazioni) e consente di apprendere congiuntamente embedding di entità e relazioni. Su FB15k-237, CompGCN ha raggiunto un MRR di 0.355, superando sia R-GCN sia modelli KGE come DistMult, dimostrando che l'aggregazione di informazione strutturale locale migliora la qualità delle rappresentazioni rispetto ai metodi basati su triple individuali.
Il vantaggio delle GNN su knowledge graph emerge in particolare per il reasoning induttivo: la capacità di generalizzare a entità mai viste durante il training. I modelli KGE tradizionali apprendono embedding specifici per ogni entità, rendendoli intrinsecamente transduttivi, incapaci di gestire nuove entità senza ri-addestramento. Le GNN, aggregando informazione dal vicinato locale, possono calcolare rappresentazioni per entità nuove basandosi sulla struttura del grafo circostante. Questa proprietà è critica in scenari di data enrichment, dove nuove entità vengono continuamente aggiunte al knowledge graph da fonti esterne.
PyTorch Geometric (PyG) [14] è il framework di riferimento per l'implementazione di GNN, con supporto nativo per grafi eterogenei e oltre 60 architetture pre-implementate. Per knowledge graph specificamente, PyG fornisce layer R-GCN e CompGCN, dataset benchmark integrati e utility per la gestione di grafi multi-relazionali su scala industriale.
Costruzione di knowledge graph da dati non strutturati
La costruzione di knowledge graph da testo non strutturato è tradizionalmente articolata in una pipeline a tre stadi: Named Entity Recognition (NER) per l'identificazione delle entità, Relation Extraction (RE) per l'estrazione delle relazioni tra entità co-occorrenti, e Entity Linking per l'allineamento delle menzioni estratte a entità canoniche in un knowledge graph di riferimento. Ciascuno stadio introduce errori che si propagano downstream, rendendo la qualità del KG risultante fortemente dipendente dall'accuratezza del primo stadio.
REBEL [15] ha proposto un cambio di paradigma: formulare l'estrazione di triple come generazione di testo, utilizzando un modello sequence-to-sequence basato su BART che produce direttamente triple (soggetto, relazione, oggetto) in un singolo passo autoregressivo. Questo approccio elimina la necessità di pipeline NER + RE separate, gestendo oltre 200 tipi di relazione Wikidata con un unico modello. Su NYT, REBEL ha raggiunto un micro F1 di 78.2 in modalità strict match, e su WebNLG 93.4 micro F1 per l'estrazione di triple relazionali, dimostrando che la formulazione generativa è competitiva con approcci pipeline specializzati.
DeepKE [16] affronta il problema da una prospettiva ingegneristica, offrendo un toolkit modulare che copre NER, RE e attribute extraction con supporto per scenari standard, low-resource e document-level. L'architettura è costruita su language model pre-addestrati e include moduli specifici per l'estrazione few-shot, critica in domini specializzati dove i dati annotati sono scarsi, un caso frequente in implementazioni enterprise dove la tassonomia del dominio è proprietaria.
L'avvento dei large language model ha aperto una terza via: la costruzione di KG guidata da LLM. Una survey del 2025 [17] documenta come gli LLM stiano trasformando i tre livelli della pipeline classica: ontology engineering (gli LLM assistono nella definizione dello schema), knowledge extraction (gli LLM sostituiscono o integrano i modelli di estrazione dedicati), e knowledge fusion (gli LLM supportano la deduplicazione e l'allineamento semantico). Il caso più documentato a scala industriale è COSMO [18], il sistema di Amazon presentato a SIGMOD 2024, che utilizza un LLM per generare ipotesi di conoscenza di common-sense a partire da pattern comportamentali degli utenti (query-acquisto, co-acquisto), filtrate da classificatori critici e poi scalate tramite un LLM più piccolo instruction-tuned. Il sistema ha prodotto un knowledge graph con 6.3 milioni di nodi e 29 milioni di archi su 18 categorie di prodotto, con un miglioramento del 60% nel macro F1 su task di raccomandazione downstream.
Indipendentemente dall'approccio, la qualità della costruzione automatica di KG rimane il collo di bottiglia principale. I benchmark accademici riportano F1 elevati su dataset curati, ma in scenari reali, testo multilingue, domini tecnici, documenti con struttura variabile, l'accuratezza degrada significativamente. La validazione umana rimane necessaria per knowledge graph ad alta affidabilità, e il design di pipeline che bilancino copertura, precisione e costo di validazione è una sfida ingegneristica aperta.
Integrazione knowledge graph e large language model
L'integrazione tra knowledge graph e large language model rappresenta una delle direzioni di ricerca più attive nel campo. Pan et al. [19] hanno proposto la tassonomia di riferimento, identificando tre paradigmi: KG-enhanced LLM, dove il knowledge graph fornisce grounding strutturato per ridurre le allucinazioni; LLM-augmented KG, dove il language model potenzia costruzione, completamento e question answering sul grafo; e synergized LLM + KG, dove i due sistemi si rinforzano bidirezionalmente.
Sul fronte del reasoning, Reasoning on Graphs (RoG) [20], pubblicato a ICLR 2024, introduce un framework planning-retrieval-reasoning in cui il KG viene utilizzato per generare piani di ragionamento fedeli, path relazionali che il LLM segue per produrre risposte fondate su fatti verificabili. Su WebQSP, RoG ha migliorato il Hits@1 di 4.4 punti percentuali rispetto allo stato dell'arte precedente; su ComplexWebQuestions, il miglioramento è stato di 22.3 punti percentuali nel Hits@1 e 14.4 nel F1, il più ampio registrato su quel benchmark al momento della pubblicazione.
Graph-Constrained Reasoning (GCR) [21] porta questo approccio al limite logico introducendo KG-Trie, un indice a trie che codifica i path di reasoning validi nel knowledge graph e viene integrato direttamente nel processo di decoding del LLM. Il risultato è che la generazione di token off-graph, cioè allucinazioni strutturali, diventa strutturalmente impossibile durante la fase di attraversamento del grafo. Questo approccio elimina la necessità di verifiche post-hoc, spostando il problema dalla mitigazione delle allucinazioni alla prevenzione architetturale.
ULTRA [22], presentato a ICLR 2024, rappresenta il primo foundation model per il reasoning su knowledge graph. A differenza dei modelli KGE tradizionali, che apprendono embedding specifici per le entità e le relazioni di un singolo grafo, ULTRA condiziona le rappresentazioni relazionali su grafi di interazione relazione-relazione, consentendo il trasferimento zero-shot a knowledge graph mai visti con vocabolari arbitrari di entità e relazioni. Un singolo modello ULTRA pre-addestrato ha raggiunto un MRR zero-shot di 0.354 su FB15k-237, comparabile a TransE e RotatE addestrati in-domain (MRR di 0.310 e 0.338 rispettivamente), sebbene ancora inferiore ai migliori metodi fully-supervised come NBFNet (0.415), e ha dimostrato generalizzazione su 57 benchmark diversi. KG-ICL [23], presentato a NeurIPS 2024, estende questa direzione con un approccio basato su in-context learning, utilizzando prompt graph e due GNN separate per codifica del prompt e reasoning sul grafo, con valutazione su 43 benchmark distinti (inclusi split transduttivi e induttivi di dataset esistenti).
Questa convergenza tra KG e LLM ha implicazioni pratiche dirette per i sistemi di Retrieval-Augmented Generation (RAG). Il paradigma GraphRAG [24] utilizza la struttura del knowledge graph per superare il problema dell'isolamento dei chunk tipico del RAG vettoriale standard: invece di recuperare frammenti di testo indipendenti, il sistema attraversa relazioni tra entità per costruire contesti coerenti e multi-hop. L'architettura richiede tre componenti: un KG che codifica le relazioni tra entità e concetti del dominio, un meccanismo di retrieval graph-based con capacità di reasoning multi-hop, e un modulo di integrazione structure-aware che preserva la coerenza logica nella generazione.
Limiti e problemi aperti
Nonostante i progressi documentati nelle sezioni precedenti, diverse sfide critiche rimangono irrisolte.
La scalabilità dei metodi di embedding e GNN su knowledge graph con miliardi di triple è un vincolo pratico significativo. Il training di modelli KGE su grafi come ogbl-wikikg2 (2.5 milioni di entità, 535 tipi di relazione) richiede infrastruttura GPU distribuita e tecniche di negative sampling efficienti. I risultati sul leaderboard Open Graph Benchmark (consultato a marzo 2026) mostrano un MRR massimo di 0.739 (RelEns), suggerendo che i benchmark a larga scala si stanno avvicinando alla saturazione per le architetture KGE attuali e che avanzamenti futuri richiederanno paradigmi diversi, come i foundation model rappresentati da ULTRA [22] e KG-ICL [23].
La dimensione temporale resta sottorappresentata nei metodi dominanti. I knowledge graph reali evolvono: relazioni cambiano, entità emergono e scompaiono. I temporal knowledge graph (TKG) associano validità temporale alle triple, ma i metodi di embedding temporale sono ancora prevalentemente valutati su benchmark relativamente piccoli come ICEWS14 e GDELT. L'integrazione con LLM introduce ulteriori sfide: il mismatch strutturale tra la topologia del grafo e la generazione sequenziale di token rende inadeguata la semplice serializzazione del grafo come input testuale.
La quality assurance nella costruzione automatica di KG rimane il collo di bottiglia per il deployment in produzione. I metodi LLM-driven generano triple con alta copertura ma precisione variabile; la validazione richiede un bilanciamento tra automazione e supervisione umana che è fortemente dipendente dal dominio applicativo. Il workshop LLM+KG a VLDB 2024 ha identificato tre sfide aperte nella gestione dati: l'evoluzione dello schema quando gli LLM generano nuove entità e relazioni a scala, la verifica dell'output LLM grounded su KG, e l'ottimizzazione di query per retrieval ibrido vettoriale e a grafo.
Infine, il gap tra benchmark accademici e deployment industriale resta ampio. I risultati su FB15k-237 e WN18RR, pur informativi, non catturano la complessità di knowledge graph enterprise con schemi proprietari, dati rumorosi e requisiti di aggiornamento continuo. COSMO [18] documenta come la fase di validazione e manutenzione del grafo rappresenti il costo operativo dominante rispetto all'addestramento dei modelli, un pattern che emerge anche nelle poche altre documentazioni pubbliche di deployment industriali, e che evidenzia un aspetto raramente affrontato nella letteratura accademica, focalizzata quasi esclusivamente sulle metriche di performance dei modelli.
Riferimenti
[1] K. Bollacker et al., "Freebase: A Collaboratively Created Graph Database for Structuring Human Knowledge," in Proc. ACM SIGMOD, 2008. https://doi.org/10.1145/1376616.1376746
[2] S. Auer et al., "DBpedia: A Nucleus for a Web of Open Data," in Proc. ISWC, 2007. https://doi.org/10.1007/978-3-540-76298-0_52
[3] W3C, "RDF 1.1 Concepts and Abstract Syntax," W3C Recommendation, 2014. https://www.w3.org/TR/rdf11-concepts/
[4] S. Pan et al., "Knowledge Graphs: Opportunity and Challenges," in IEEE Transactions on Neural Networks and Learning Systems, 2024. https://doi.org/10.1109/TNNLS.2023.3326676
[5] W3C, "SPARQL 1.1 Query Language," W3C Recommendation, 2013. https://www.w3.org/TR/sparql11-query/
[6] D. Vrandecic, M. Krötzsch, "Wikidata: A Free Collaborative Knowledge Base," in Communications of the ACM, vol. 57, no. 10, 2014. https://doi.org/10.1145/2629489
[7] A. Bordes et al., "Translating Embeddings for Modeling Multi-relational Data," in Proc. NeurIPS, 2013. https://proceedings.neurips.cc/paper/2013/hash/1cecc7a77928ca8133fa24680a88d2f9-Abstract.html
[8] Z. Wang et al., "Knowledge Graph Embedding by Translating on Hyperplanes," in Proc. AAAI, 2014. https://ojs.aaai.org/index.php/AAAI/article/view/8870
[9] Z. Sun et al., "RotatE: Knowledge Graph Embedding by Relational Rotation in Complex Space," in Proc. ICLR, 2019. https://arxiv.org/abs/1902.10197
[10] P. Jiang et al., "KG-FIT: Knowledge Graph Fine-Tuning Upon Open-World Knowledge," in Proc. NeurIPS, 2024. https://arxiv.org/abs/2405.16412
[11] M. Ali et al., "PyKEEN 1.0: A Python Library for Training and Evaluating Knowledge Graph Embedding Models," in JMLR, vol. 22, 2021. https://jmlr.org/papers/v22/20-825.html
[12] M. Schlichtkrull et al., "Modeling Relational Data with Graph Convolutional Networks," in Proc. ESWC, 2018. https://arxiv.org/abs/1703.06103
[13] S. Vashishth et al., "Composition-based Multi-Relational Graph Convolutional Networks," in Proc. ICLR, 2020. https://arxiv.org/abs/1911.03082
[14] M. Fey, J. E. Lenssen, "Fast Graph Representation Learning with PyTorch Geometric," in ICLR Workshop on Representation Learning on Graphs and Manifolds, 2019. https://arxiv.org/abs/1903.02428
[15] P.-L. Huguet Cabot, R. Navigli, "REBEL: Relation Extraction By End-to-end Language generation," in Findings of EMNLP, 2021. https://arxiv.org/abs/2110.04085
[16] N. Zhang et al., "DeepKE: A Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population," in Proc. EMNLP System Demonstrations, 2022. https://arxiv.org/abs/2201.03335
[17] Y. Jiang et al., "LLM-Empowered Knowledge Graph Construction: A Survey," arXiv:2510.20345, 2025. https://arxiv.org/abs/2510.20345
[18] C. Yu et al., "COSMO: A Large-Scale E-Commerce Common Sense Knowledge Generation and Serving System at Amazon," in Proc. ACM SIGMOD, 2024. https://dl.acm.org/doi/10.1145/3626246.3653398
[19] S. Pan et al., "Unifying Large Language Models and Knowledge Graphs: A Roadmap," in IEEE TKDE, vol. 36, no. 7, 2024. https://arxiv.org/abs/2306.08302
[20] L. Luo et al., "Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasoning," in Proc. ICLR, 2024. https://arxiv.org/abs/2310.01061
[21] P. Jiang et al., "Graph-constrained Reasoning: Faithful Reasoning on Knowledge Graphs with Large Language Models," in Proc. ICML, 2025. https://arxiv.org/abs/2410.13080
[22] M. Galkin et al., "Towards Foundation Models for Knowledge Graph Reasoning," in Proc. ICLR, 2024. https://arxiv.org/abs/2310.04562
[23] Y. Cui et al., "A Prompt-Based Knowledge Graph Foundation Model for Universal In-Context Reasoning," in Proc. NeurIPS, 2024. https://arxiv.org/abs/2410.12288
[24] D. Edge et al., "From Local to Global: A Graph RAG Approach to Query-Focused Summarization," arXiv:2404.16130, 2024. https://arxiv.org/abs/2404.16130