Modelli predittivi della funzione renale dopo il trapianto: un ponte verso un’immunosoppressione personalizzata

Luca Guzzetti1, Giuseppe Ietto2, Cristiano Salvino Baglieri3, Mirco Gallazzi4, Domenico Iovino2, Alessandro Bacuzzi1, Giulio Carcano2

1. Servizio di Anestesia, ASST dei Sette Laghi; 2. Università degli Studi dell’Insubria, Chirurgia Generale, d’Urgenza e dei Trapianti, ASST dei Sette Laghi; 3. Università degli Studi di Bologna, Scuola di Specialità in Medicina del Lavoro, IRCCS Azienda Ospedaliero-Universitaria Sant’Orsola; 4. Università degli Studi dell’Insubria, Corso di Laurea Specialistica in Informatica.

Pervenuto il 13 gennaio 2022.

Riassunto. Introduzione. Il trapianto renale è il miglior trattamento per la malattia renale allo stadio terminale, tuttavia, nel 20% dei casi, l’organo trapiantato ha un ritardo nel recupero funzionale. Questa situazione è definita come Delayed Graft Function (DGF) ed implica un rischio per il rene trapiantato di veder compromessa la sua funzione non solo nell’immediato, ma anche sul lungo periodo in termini di durata complessiva del trapianto. Lo scopo che ci siamo prefissati è stato quindi di individuare i sistemi a punteggio disponibili per stratificare il rischio di DGF nella popolazione dei pazienti candidati a trapianto renale al fine di implementare protocolli di terapia immunosoppressiva specifici per ciascuna classe di rischio. Materiali e metodi. Abbiamo effettuato una revisione sistematica della letteratura per identificare tutti i sistemi a punteggio predittivi di DGF disponibili. Tra essi abbiamo definito quelli applicabili alla nostra popolazione e ne abbiamo confrontato l’accuratezza diagnostica. Risultati. La nostra popolazione constava di 247 pazienti trapiantati di rene, tra i quali 41 (15,95%) hanno sviluppato una DGF. Tre dei 7 sistemi a punteggio predittivi di DGF disponibili nella letteratura scientifica sono risultati applicabili. Lo score di Irish ha riconosciuto 25 casi di DGF su 41 (60,98%), lo score di Jeldres 41 casi su 41 (100%) e lo score di Chapal solo 7 su 41 (17,07%). Sebbene lo score di Irish non abbia identificato tutti i casi di DGF, la rielaborazione statistica ha rivelato che è il più accurato per la popolazione in esame. Conclusioni. Il nostro studio identifica lo score di Irish quale più accurato tra quelli ad oggi disponibili, per una popolazione di pazienti candidati a trapianto renale in Italia. Questo primo risultato è da considerarsi solo come base per lo sviluppo di un nuovo e più accurato modello predittivo per la stima del rischio DGF, il quale potrebbe trarre vantaggio dalle moderne tecniche di “machine learning” e da uno studio multicentrico, su una più ampia popolazione.

Parole chiave: trapianto renale, delayed graft function, DGF, rigetto, terapia immunosoppressiva, machine learning.

Predictive models of renal function after transplantation: a bridge towards a tailored immunosuppression

Summary. Background. Renal transplantation is the gold standard treatment for end-stage renal disease, however, in 20% of cases, the graft develops a delayed graft function (DGF) that is associated with both early and late worsening of the outcome. The aim of our project was to explore the available scoring systems for DGF risk assessment in order to stratify the transplant recipients population for tailoring immunosuppressive therapy. Materials and methods. We conducted a systematic review of the literature to identify all the scoring systems predicting DGF to identify those applicable to the study population and subsequently comparing their appropriateness for defining the most accurate one. Results. We enrolled retrospectively a population of 247 renal transplanted patients where 41 cases (15.95%) developed DGF. For our population 3 of the 7 scoring systems to predict DGF available in scientific literature have resulted fit. The Irish score recognized 25 of 41 cases (60.98%), the Jeldres score 41 of 41 cases (100%), and the Chapal score only 7 of 41 (17.07%). Although the Irish score did not identify all cases of DGF, the analysis of data revealed that it is the most accurate, with area under the receiver operating characteristic almost overlapping. Conclusions. Our study identifies the Irish score as the most reliable for a population of transplant recipients in Italy. This first result has to be considered only as the base for the development of a new and more accurate predictive model for DGF risk assessment, which could benefit from the machine learning methods on a larger and multicentric population.

Key words: kidney transplant, delayed graft function, DGF, rejection, immunosuppressive therapy, machine learning.

Introduzione

La migliore scelta terapeutica per il trattamento dell’insufficienza renale terminale è il trapianto di rene. La sua efficacia in termini di sopravvivenza e di qualità di vita è ottimale, ma il dato di “Primary Non-Function” annulla drasticamente i benefici appena elencati. Attualmente, l’attenzione della ricerca scientifica è focalizzata sulla Delayed Graft Function (DGF) definita come necessità emodialitica nei giorni seguenti il trapianto1-3. Tale complicanza è associata ad un peggiore outcome trapiantologico sia a breve come a lungo termine. La sua eziologia è eterogenea e i principali attori in causa sono il periodo di ischemia riperfusione, la cascata immunomediata, i fattori clinici legati al ricevente e al donatore4,5. Per tali motivi diversi autori hanno studiato score che possono facilitare nella stratificazione e successiva gestione del rischio di sviluppo di DGF. Nel nostro centro abbiamo voluto eseguire un’analisi retrospettiva della nostra popolazione per determinare quale score potesse essere il più appropriato nel predire il DGF dei nostri pazienti. Il progetto nasce per stratificare la popolazione per il rischio di sviluppo di DGF e definire quali strategie immunosoppressive implementare a misura di ogni singolo paziente in base al rischio pre-trapianto. Pertanto il nostro obiettivo è generare delle terapie immunosoppressive personalizzate legate a fattori “donor and recipient related” per ottimizzare il percorso trapiantologico in termini clinici ed economico-sanitari.

Materiali e metodi

In figura 1 abbiamo riportato la revisione sistematica della letteratura in PubMed (MEDLINE biomedical database) con i criteri di ricerca: Delayed Graft Function plus prediction risk score.




Dall’analisi dei 14 articoli finali sono emersi sette score mostrati in tabella I.

Di questi abbiamo escluso gli score che non richiedevano dati clinici del recipient, score incentrati sulle caratteristiche del graft6-8. Oltremodo lo studio di Nygaard et al.9 è stato escluso in quanto l’obiettivo primario non era lo sviluppo di uno score.

Il nostro lavoro, essendo retrospettivo, ha necessitato di una ulteriore modulazione degli score presi in esame. In tabella II sono mostrati gli score finali.




Dopo una revisione della nostra popolazione abbiamo potuto raccogliere dati su 257 trapianti renali attraverso la consultazione dell’Archivio Clinico Ospedaliero, Donor Manager® e Galenus®, e conservati in un apposito database nosocomiale dedicato e protetto (Microsoft Office – Excel® 2017). Lo score di Irish et al.10 è stato applicato a 155 trapianti (60,31% del totale), quello di Jeldres et al.11 a 235 trapianti (91,05% del totale), quello di Chapal et al.12 soltanto a 41 trapianti (15,95% del totale) per i restrittivi criteri di esclusione. Infine, lo score ideato da Zaza et al.13 non è stato potuto applicare a causa di metodi per il calcolo non usufruibili ed è stato escluso dallo studio. Dai calcoli sono stati esclusi 7 pazienti con diagnosi di PNF (Primary Non-Function) ed i rigetti acuti con sospetta PNF (n=3). I calcoli probabilistici, per la predittività della DGF, sono stati eseguiti utilizzando programmi web di libero accesso (ove disponibili) o modelli strutturati in base ai rispettivi nomogrammi con l’utilizzo di una tabella Excel®. Nello specifico:

– Transplant Calculator (www.transplantcalculator.com)11;

– DGF score (DGFS DIVAT)12;

– File Excel strutturato sul nomogramma specifico11.

Lo score Irish evidenziava la presenza di 5 parametri fondamentali per il calcolo probabilistico, lasciando ai rimanenti la possibilità di segnarli come “indeterminati”. Tali fattori fondamentali sono: razza e sesso del ricevente, creatinina sierica terminale e peso del donatore, e mancate corrispondenze HLA-A, -B, -DR. Lo score Chapal, invece, presentava altri 5 parametri fondamentali richiesti per il calcolo della DGF, rappresentati da: tempo di ischemia fredda, età del donatore, indice di massa corporea del ricevente, creatinina sierica terminale e terapia di induzione con ATG. Lo score Jeldres, infine, aveva come unico parametro fondamentale l’età del donatore, potendo indicare gli altri parametri mancanti come “indeterminati”. I calcoli statistici sono stati eseguiti tramite il programma MedCalc® Versione 18.11.16. La normalità è stata testata con i test Shapiro-Wilk e Q-Q plot. I dati distribuiti normalmente sono stati rappresentati come media e deviazione standard; dati non normalmente distribuiti, sono stati espressi come mediana con P25 e P75. Le varabili categoriali sono state presentate come numeri e percentuali. Le AUC-ROCs sono state estrapolate per ogni singolo score e messe a confronto con le AUC-ROCs originali; in seguito, le AUC-ROCs di ogni score, ottenute dal nostro studio, sono state confrontate tra loro.

Risultati

Sul totale della popolazione studiata presso il nostro Centro Trapianti di Varese ASST – Settelaghi (257 pazienti) 7 pazienti hanno avuto una PNF (primary non function) mentre 3 hanno sviluppato un rigetto acuto, pertanto la nostra analisi è stata eseguita su un campione di 247 pazienti. In tabella III sono mostrate le caratteristiche cliniche e demografiche dei donatori, riceventi e del graft.




Lo score elaborato da Irish et al.10 è stato applicato al 60% dei pazienti (155), quello di Jedres et al.11 al 91% dei pazienti (235) mentre lo score di Chapal et al.12 è stato applicato al 16% della popolazione (41 pazienti). Il modello predittivo elaborato da Zaza et al.13, invece, non è stato possibile applicarlo per problemi metodologici. Pertanto, sulla nostra popolazione sono stati applicati i 3 score (Irish, Chapal e Jeldres), estrapolando le corrispettive cure ROC (figure 2.1, 2.2, 2.3). Ogni grafico è stato confrontato con i relativi risultati dei lavori originali presenti in letteratura, in particolar modo attraverso il confronto delle varie aree sotto la curva e la significatività statistica risultante. Ciò che è emerso dai confronti, è che l’AUC-ROC dello score Irish ottenuta con i nostri calcoli è di 0,69. Inoltre, preso singolarmente, lo score mostra una significatività statistica rilevante (p < 0,001). Per quanto riguarda il confronto tra AUC-ROC dello score Chapal applicato alla nostra popolazione con il corrispettivo originale, il risultato ottenuto nel nostro studio è di 0,57 e non risulta statisticamente significativo (p = 0,553). Per ultimo, il confronto dell’AUC-ROC dello score Jeldres con la nostra popolazione è di 0,60, lontano dallo 0,74 dello studio originale, statisticamente quasi significativo (p = 0,050). I tre score sono stati confrontati tra di loro (figura 2.4).




Dal confronto è emerso che nessuno di loro risulta statisticamente significativo, con un p-value sempre al di sopra dello 0,05.

Discussione

Il trapianto di rene per il trattamento dell’IRC terminale è una procedura chirurgica ormai consolidata che ha portato notevoli benefici in termini di qualità della vita a numerosi pazienti dializzati. La DGF è una condizione clinica sfavorevole, poiché sembra essere correlata ad una ridotta sopravvivenza del graft con un grave impatto in termini di qualità di vita. Inoltre, tale fenomeno clinico porta con sé una degenza più lunga del paziente, un ritorno all’emodialisi nell’immediato post-operatorio, una maggiore complessità nel trattamento farmacologico del paziente con rischio di complicanze infettivologiche (con impatto sia a livello piscologico che fisico per il ricevente) e ad un aumento della spesa sanitaria. Numerosi sforzi sono stati fatti nel mondo scientifico, nel tentativo di ricercare dei parametri predittivi per la DGF attraverso la costruzione di modelli basati su scale di punteggi, in modo da facilitare il lavoro dei clinici nel trattamento di quei pazienti più fragili e con maggiore rischio di sviluppare un ritardo di funzionalità. Irish et al.10,14 e successivamente Jeldres et al.11 hanno validato degli score sulla popolazione nordamericana ottenendo buoni risultati. In Europa, Chapal et al.12 hanno sviluppato uno specifico score predittivo per la DGF validandolo sulla popolazione francese. In Italia, Zaza et al.13 hanno validato un loro score attraverso uno studio multicentrico su quattro Ospedali presenti nel territorio nazionale. Sempre in Europa, Rodrigo et al.15 hanno tentato di convalidare lo score Irish nella popolazione spagnola, ottenendo risultati pressoché sovrapponibili. Nel 2017, Michalak M et al.16 fecero lo stesso applicando tre score, per uno studio a livello di popolazione, in Belgio (Irish, Jeldres, Chapal) evidenziando una capacità predittiva della DGF per l’Irish sovrapponibile alla realtà della loro popolazione, mostrando invece una scarsa predittività per lo score Jeldres ed una performance peggiore per lo Chapal. Un successivo lavoro, simile al precedente, venne svolto nel 2018 da Kers J. et al.17, nel tentativo di validare la riproducibilità di quattro score (Irish, Jeldres, Chapal, Zaza) nella popolazione olandese. I risultati ottenuti hanno evidenziato, ancora una volta, una maggiore accuratezza dello score Irish rispetto agli altri tre, con AUC-ROC pressoché sovrapponibili. In base a questi risultati, abbiamo deciso di effettuare una validazione della riproducibilità di tre score (Irish, Chapal, Jeldres) nella nostra popolazione. Considerando che tali score sono stati già ampiamente studiati e validati, ci siamo soffermati esclusivamente sul confronto delle AUCROC ottenute sulla nostra popolazione con le AUCROC estrapolate dagli studi originali. È emerso che singolarmente, soltanto lo score Irish presenta un p-value < 0,001, con AUC dello 0,69 (0,70 quella originale), una sensibilità del 76,0% ed una specificità del 63,1%, evidenziando una discreta capacità predittiva. Il confronto tra le AUCROC dei 3 score, invece, non ha evidenziato alcuna significatività statistica, con p-value superiori a 0,05. Sulla base di questi risultati, abbiamo deciso di considerare lo score Irish come modello più accurato per la predittività delle future DGF nei riceventi di trapianto renale da donatore deceduto, nonostante un valore di statistica-c (o di area sotto la curva, AUC) di 0,69 non sia particolarmente discriminante. Questo lavoro si inserisce in un progetto più ampio, portato avanti dal nostro gruppo di ricerca, che ha come obiettivo quello di arrivare a proporre una terapia immunosoppressiva ritagliata su misura per ogni singolo paziente che va incontro a trapianto renale, al fine di ridurre il tasso di DGF migliorando così l’outcome immediato ed a lungo termine del graft. L’utilizzo di tecniche quantitative di perfusione intraoperatoria del graft, già discusse dal nostro gruppo di lavoro in letteratura18, in associazione con fattori predittivi pre-trapianto, potrebbero implementare il successo del trapianto renale. Oltremodo il progetto di ricerca sarà completato dalla genotipizzazione del cit. P450 (isoforme 3A4 e 3A5) per i pazienti riconosciuti a maggior rischio. Le isoforme in questione del citocromo P450 sono responsabili di una velocità di metabolizzazione molto differente degli inibitori della calcineurina, che tuttora risultano i principali immunosoppressori con documentata nefrotossicità; riconoscere, individuare e documentare la velocità di metabolizzazione permetterebbe di ottimizzare l’esposizione al farmaco non aumentando il rischio di rigetto ma limitandone l’effetto tossico.

Conclusioni

Possiamo affermare di aver trovato un primo tassello per lo sviluppo di un algoritmo terapeutico personalizzato da applicare a tutti i riceventi con elevata probabilità di sviluppare una DGF. I limiti intrinseci di tale lavoro risultano essere legati ad una popolazione in esame ridotta, alla monocentricità dello studio e al carattere retrospettivo della nostra analisi. Pertanto, è necessario abbassare i bias di questa analisi cercando di coinvolgere altri centri trapiantologici in un progetto ambizioso: generare modelli predittivi multivariabili che potrebbero concepire processi di “machine learning”. Infatti, con l’enorme mole di dati derivante dalla collaborazione di queste diverse strutture, sarebbe possibile allenare tali processi in modo da generare delle predizioni sempre più precise e accurate che, a loro volta, porterebbero a risultati molto più concreti e attendibili. Nella medicina contemporanea lo sviluppo dell’intelligenza artificiale sta guadagnando ampio spazio garantendo un valido aiuto nella pratica clinica19-22. Le realtà già in essere rispondono a domande precise ma in letteratura non esistono dati di intelligenza artificiale che predicano lo sviluppo di DGF. In uno sforzo corale di vari centri trapiantologici sarebbe utile avere: ampia disponibilità di grandi set di dati e garantire un avanzamento dell’hardware per eseguire una proficua attività di elaborazione parallela.

Conflitto di interessi: gli autori dichiarano l’assenza di conflitto di interesse.

L’articolo è una rielaborazione in italiano di: Ietto G, Guzzetti L, Baglieri CS, et al. Predictive models for the functional recovery of transplanted kidney. Transplant Proc 2021; 53: 2873-8.




Bibliografia

1. Humar A, Payne WD, Sutherland DE, Matas AJ. Clinical determinants of Hetzel multiple acute rejection episodes in kidney transplant recipients. Transplantation 2000; 69: 2357-60.

2. Mallon HD, Summers DM, Bradley JA, et al. Defining delayed graft function after renal transplantation: simplest is best. Transplantation 2013; 96: 885-9.

3. Yarlagadda SG, Coca SG, Garg AX, Doshi M, Poggio E, Marcus RJ, et al. Marked variation in the definition and diagnosis of delayed graft function: a systematic review. Nephrol Dial Transplant 2008; 23: 2995-3003.

4. Pieringer H, Biesenbach G. Risk factors for delayed kidney function and impact of delayed function on patient and graft survival in adult graft recipients. Clin Trasplant 2005; 19: 391-8.

5. Siedlecki A, Irish W, Brennan DC. Delayed graft function in the kidney transplant. Am J Transplant 2011; 11: 2279-96.

6. Gourishankar S, Grebe SO, Mueller TF. Prediction of kidney graft failure using clinical scoring tools. Clin Transplant 2013; 27: 517-22.

7. Nyberg SL, Matas AJ, Rogers M, et al. Donor scoring system for cadaveric renal transplantation. Am J Transplant 2001; 1: 162-70.

8. Nyberg SL, Matas AJ, Kremers WK, et al. Improved scoring system to assess adult donors for cadaver renal transplantation. Am J Transplant 2003; 3: 715-21.

9. Nygaard RM, Sirany AM, Wyman EA, et al. A clinical tool to risk stratify potential kidney transplant recipients and predict severe adverse events. Clin Transplant 2016; 30: 1494-500.

10. Irish WD, Ilsley JN, Schnitzler MA, et al. A risk prediction model for delayed graft function in the current era of deceased donor renal transplantation. Am J Transplant 2010; 10: 2279-86.

11. Jeldres C, Cardinal H, Duclos A, et al. Prediction of delayed graft function after renal transplantation. Can Urol Assoc J 2009; 3: 377-82.

12. Chapal M, Le Borgne F, Legendre C, et al. A useful scoring system for the prediction and management of delayed graft function following kidney transplantation from cadaveric donors. Kidney Int 2014; 86: 1130-9.

13. Zaza G, Ferraro PM, Tessari G, et al. Predictive model for delayed graft function based on easily avaible pre-renal transplant variables. Intern Emerg Med 2015; 10: 135-41.

14. Irish WD, McCollum DA, Tesi RJ, Owen AB, Brennan DC, Bailly JE, et al. Nomogram for prediction the likelihood of delayed graft function in adult cadaveric renal transplant recipients. J Am Soc Nephrol 2003; 14: 2967-74.

15. Rodrigo E, Miñambres E, Ruiz JC et al. Prediction of delayed graft function by means of a novel web-based calculator: a single-center experience. Am J Transplant 2012; 12: 240-4.

16. Michalak M, Wouters K, Fransen E, et al. Prediction of delayed graft function using different scoring algorithms: a single-center experience. World J Transplant 2017; 7: 260-8.

17. Kers J, Peters-Sengers H, Heemskerk MBA, et al. Prediction models for delayed graft function: external validation on the Dutch Prospective Renal Transplantation Registry. Nephrol Dial Transplant 2018; 33: 1259-68.

18. Ietto G., Zani E., Benedetti F. et al. Indocyanine Green Angiography for Quality Assessment of the Kidney During Transplantation: An Outcome Predictor Prospective Study. Transplant Proc Jul-Aug 2021; 53: 1892-1896.

19. Thrall JH, Li X, Li Q, Cruz C, Do S, Dreyer K, Brink J: Artificial intelligence and machine learning in radiology: Opportunities, challenges, pitfalls, and criteria for success. J Am Coll Radiol 2018; 15: 504-8.

20. Salto-Tellez M, Maxwell P, Hamilton P: Artificial intelligence-the third revolution in pathology. Histopathology 2019; 74: 372-6.

21. Deo RC: Machine learning in medicine. Circulation 2015; 132: 1920-30.

22. Hashimoto DA, Rosman G, Rus D, Meireles OR: Artificial intelligence in surgery: Promises and perils. Ann Surg 2018; 268:70-6.