Il libro
2   INTRODUZIONE ALLA BIOSTATISTICA
2.1   DALLA PROBABILITÀ ALL’ANALISI DECISIONALE CLINICA



Nella pratica clinica quotidiana ci confrontiamo continuamente con probabilità. Quando prescriviamo un farmaco che riteniamo efficace sulla base dei risultati di trial clinici ben condotti, non abbiamo la certezza assoluta che quel farmaco produrrà gli effetti attesi nel particolare paziente al quale lo stiamo prescrivendo. Allo stesso modo quando prendiamo in considerazione i fattori di rischio di una certa malattia, per esempio il rischio di infarto miocardico, non siamo assolutamente certi che la nostra prognosi, basata su studi accurati del rischio cardiovascolare nella popolazione generale, ci consentirà di predire esattamente il rischio di infarto in quel determinato paziente. L'attività del medico è interamente basata su probabilità. Alla fine del capitolo combineremo alcuni dei concetti presentati in questo capitolo in un esempio concreto di analisi decisionale clinica.


2.1.1   Probabilità, frequenze, eventi, osservazioni

La probabilità può essere definita come l'espressione matematica di quante volte (frequenza) noi ci aspettiamo che un certo evento avvenga rispetto al numero di volte teorico che questo evento possa avvenire. Per esempio in un paziente che ha un dolore molto forte alla regione lombare destra e disuria noi stimiamo che la probabilità che egli abbia un calcolo renale sia 0.3 o 30%. Questo vuol dire che noi ci aspettiamo che 30 pazienti ogni 100 che presentano quella sintomatologia abbiano calcoli renali.

In termini statistici un evento (per es. la colica renale, un episodio infartuale) ha solo due condizioni: può avvenire o non avvenire. Le opportunità che l'evento si verifichi si definiscono osservazioni. I pazienti con dolore colico o con sintomatologia anginosa sono osservazioni. Quindi la probabilità è il rapporto (proporzione) tra la frequenza osservata di un certo evento rispetto al numero di osservazioni. Nel nostro esempio, 30 pazienti con dolore colico e calcoli/100 pazienti con dolore colico. Ancora, se in una certa regione nel 1997 ci sono 200 pazienti uremici che hanno iniziato il trattamento dialitico e tra questi ne sono morti 20 nel corso dello stesso anno, la probabilità di morte nel primo anno di dialisi è:

20 decessi ("eventi")/200 pazienti che hanno iniziato la dialisi ("osservazioni")
= 0.1 o 10%


Vale la pena sottolineare che la probabilità viene in genere riportata come frazione dell'unità (0.5, 0.7, ecc.) e che essa può variare tra 0 (se l'evento è impossibile) e 1 (se l'evento è assolutamente certo). La probabilità viene spesso anche riportata in termini percentuali (10%, 20%, ecc.) cioè in termini di frequenza relativa. I due modi di quantificare la probabilità sono perfettamente equivalenti, per ottenere la frequenza relativa basta moltiplicare la probabilità (come frazione dell'unità) per 100.

Abbiamo detto che un evento può avere solo due condizioni: può avvenire o può non avvenire. La probabilità che un evento non avvenga viene definita complemento dell'evento. Se la probabilità di trovare un calcolo renale è 0.3 o 30%, il complemento dell'evento, cioè la probabilità che il paziente non abbia un calcolo è 0.7 o 70%. La somma delle probabilità di un evento e del suo complemento è uguale all'unità. La simbologia matematica di questo concetto è la seguente: Introducendo un nuovo esempio che riguarda la mortalità, se in un'area geografica in cui vivono circa 300000 abitanti di età compresa tra 45 e 55 anni nel 1995 si verificano 3000 morti per cardiopatia ischemica, la probabilità di morte per questa causa è 3000/300000 cioè 0.01 (o 1 ogni 100 abitanti). La probabilità di non morire di cardiopatia ischemica (cioè il complemento dell'evento, o p(non evento) = 1 - p (evento) è 0.99. Da sottolineare che il complemento dell'evento morte tra i 45/55enni non è la sopravvivenza ma quello di non morire per cardiopatia ischemica. Il complemento dell'evento ha la caratteristica di essere esaustivo cioè di includere tutte le possibilità eccetto quella contemplata dall'evento. In altri termini il complemento include anche la possibilità di morte per cancro, incidenti stradali, ecc. Nei certificati di morte la causa di morte è definita in maniera univoca: non si può morire per cardiopatia ischemica e per cancro (questa è una convenzione stabilita per la compilazione dei certificati di morte). Pertanto, un'altra caratteristica della probabilità associata con la mortalità è quella della mutua esclusione (delle cause di morte). La morbilità, a differenza della mortalità, può invece essere multipla (si può essere diabetici, avere cardiopatia ischemica e avere una malattia renale).


2.1.2   Come combinare gli eventi

Intersezione di eventi

Si dice che due eventi si intersecano quando essi avvengono contemporaneamente e sono indipendenti l'uno dall'altro o quando la probabilità che uno di essi avvenga dipende da uno o più eventi (probabilità condizionata). Per calcolare la probabilità combinata di due o più eventi che non siano mutuamente esclusivi (come le cause di morte) è essenziale prima di tutto definire se gli eventi sono tra loro indipendenti o meno.

Eventi indipendenti

Gli eventi che non sono mutuamente esclusivi, come i dati di morbilità, possono combinarsi, possono cioè verificarsi contemporaneamente. Se questi eventi sono tra loro indipendenti la probabilità che essi si verifichino in maniera contemporanea si calcola moltiplicando le probabilità individuali degli eventi.

p(A e B e C) = p(A) x p(B) x p(C)


Per 3 eventi indipendenti che hanno probabilità 0.7, 0.2 e 0.3, la probabilità che essi si verifichino contemporaneamente è 0.7 x 0.2 x 0.3 = 0.042. è importante sottolineare che questa regola "moltiplicatoria" è valida solo se gli eventi sono indipendenti. Per esempio le probabilità di cardiopatia ischemica e malattia renale in un paziente diabetico non sono indipendenti perché il diabete predispone a entrambe le complicazioni. Viceversa possiamo fare l'assunzione che la probabilità di cancro e quella di malattia renale siano indipendenti. Questo tipo di probabilità (associazione di eventi indipendenti) è definito "probabilità senza condizioni".

Eventi condizionati

Quando invece un evento almeno in parte dipende da uno o più eventi (cioè è "condizionato" da questi) l'approccio è differente. Prima di tutto bisogna definire quale sia l'evento condizionante e quello "condizionato". In termini generali diciamo p(A|B), probabilità di A dato l'evento B. Per esempio, circa il 40% dei pazienti in emodialisi sono fumatori e il 20% sono ipertesi e fumatori. Se vogliamo calcolare la probabilità che ha un certo paziente iperteso di essere anche fumatore, dobbiamo partire dall'evento condizionante: cioè dalla proporzione dei fumatori, p(B). La proporzione di ipertesi tra i fumatori, p(A), in questo caso è l'evento condizionato. Per calcolare la proporzione dei fumatori ipertesi dobbiamo prima di tutto dividere la probabilità simultanea dei due eventi [ipertensione e fumo: p(A) x p(B)] per l'evento condizionante, p(B), il fumo. In questo caso 0.20/0.40 = 0.50 (nota 1). Questo rapporto non è altro che la proporzione degli ipertesi tra i fumatori o p(A|B).
Andando alle formule:

p(A|B) = [p(A) x p(B)]/p(B)


Moltiplicando entrambi i termini per p(B):

p(A|B) x P(B) = [p(A) x p(B)]/p(B) x p(B)
Semplificando:

p(A) x p(B) = p(B) x p(A|B)


Questa formula ci consente di estendere l'analisi a più di due eventi per i quali non si può fare assunzione di indipendenza. Per esempio se abbiamo 3 eventi A, B, C, la probabilità dei 3 eventi p(A) e p(B) e p(C) = p(A) x p(A|B) x p(C|AB).
Dove p(C|AB) rappresenta la probabilità dell'evento C dati gli eventi A e B. Per esempio l'evento C può essere la probabilità che il paziente abbia un alto intake di sale. Quindi la probabilità combinata definisce in questo caso la probabilità di ipertensione (A) data l'abitudine al fumo (B) e un alto consumo di sale (C). La combinazione degli eventi condizionanti è ininfluente [per esempio p(C) x p(B|C) x p(A|BC)]: il risultato, comunque si combinino gli eventi condizionanti, è sempre identico.

Per cercare di rendere più concreto il nostro esempio e per chiarire ulteriormente la differenza tra eventi indipendenti ed eventi condizionati consideriamo una situazione reale: i pazienti uremici che afferiscono al nostro servizio dialisi sono 100 e il 40% (cioè 40 pazienti) di questi sono fumatori e il 50% (cioè 50 pazienti) sono ipertesi. Andando a verificare la proporzione di fumatori tra gli ipertesi ci accorgiamo che 35 dei 50 pazienti ipertesi sono fumatori. Ci interessa calcolare la probabilità che ha un paziente fumatore di essere anche iperteso. Se l'ipertensione e il fumo fossero eventi indipendenti la probabilità di ipertensione dovrebbe essere uguale tra i pazienti fumatori e tra i non fumatori: il 50% dei fumatori (20 pazienti) e il 50% dei non fumatori (30 pazienti) dovrebbero essere ipertesi. In realtà non è così perché noi abbiamo verificato che i tra i nostri ipertesi il 70% sono fumatori (35 su 50 pazienti). L'eccessivo numero di fumatori tra gli ipertesi lascia pensare che in realtà i due eventi, fumo e ipertensione, non siano indipendenti. Il calcolo della probabilità che ha un paziente fumatore di essere anche iperteso si può fare in maniera diretta dividendo gli ipertesi fumatori (35) per il numero totale di pazienti (100) ottenendo direttamente 0.35 o 35%. Se volessimo applicare pedissequamente la formula, p(A) x p(B) = p(B) x p(A|B). Allora dovremmo calcolare prima la p(A|B) = p(A) e p(B)/p(B), quindi 35/40 = 0.875 e poi moltiplicare questo risultato per la probabilità di essere fumatore (40 su 100 pazienti sono fumatori, quindi la probabilità è 0.40). Il risultato finale sarebbe identico: 0.35 o 35%.

L'esempio illustra come si fa a decidere quando due eventi sono indipendenti o quando uno dei due condiziona l'altro. In questo esempio, l'osservare che il 70% degli ipertesi erano fumatori ci ha fatto sospettare che il fumo condizionasse l'ipertensione (perché la proporzione di fumatori era più alta nei soggetti ipertesi). Per decidere se due eventi sono indipendenti basta effettuare due volte il calcolo di una certa probabilità (nel nostro caso la probabilità che un iperteso sia fumatore): la prima volta si fa l'assunzione che i due eventi siano indipendenti, si applica cioè la regola moltiplicatoria. Si ripete quindi il calcolo assumendo che uno dei due eventi condizioni l'altro. Se i due risultati coincidono allora i due eventi sono realmente indipendenti, altrimenti uno dei due condiziona l'altro e la maniera corretta di procedere è quella di utilizzare le formule riservate agli eventi condizionati.

Unione di eventi

Abbiamo visto che l'intersezione (la sovrapposizione) di due eventi è il verificarsi contemporaneo di entrambi a prescindere dai loro rapporti di dipendenza. In questi casi noi siamo interessati a stabilire la probabilità che gli eventi si verifichino insieme, cioè l'uno e l'altro. Nell'attività clinica è invece molto frequente che il nostro interesse si concentri anche su eventi separati (l'uno e/o l'altro). Per esempio possiamo decidere di intensificare i controlli clinici se un certo paziente è diabetico e/o ha uno scarso supporto familiare. In questo caso quello che ci interessa è l'unione degli eventi cioè la probabilità che avvenga uno e/o l'altro di essi. La differenza tra l'intersezione e l'unione è mostrata nella Figura 2.1.
Per esempio il medico riterrà necessario sorvegliare più attentamente i pazienti che abbiano un eccesso ponderale e/o che siano fumatori. In questo caso al medico interessa conoscere la probabilità che i suoi pazienti abbiano un eccesso ponderale e/o siano fumatori.

Se i due eventi (eccesso ponderale e fumo) sono mutuamente esclusivi (se cioè i pazienti grassi sono tutti non fumatori e se tutti i fumatori sono magri), la somma delle probabilità degli eventi è uguale alla somma delle probabilità dei singoli eventi:

P(A o B o......) = p(A)+p(B)+ ......


Se gli eventi non sono indipendenti (alcuni fumatori possono essere anche grassi e viceversa) dobbiamo sottrarre alla probabilità calcolata come sopra (eventi mutuamente esclusivi) l'area di sovrapposizione delle probabilità [nel nostro caso la probabilità che i pazienti siano fumatori e grassi, cioè la probabilità p(A) e p(B)]. Quindi la formula per due eventi non mutuamente esclusivi è:

P(A o B) = p(A) + p(B) - p(A e B)


Questa formula può essere ovviamente estesa a tre o più eventi sottraendo, ogni volta che sia necessario, la probabilità connessa alla non mutua esclusione degli eventi. La medicina clinica è tutta basata sul calcolo delle probabilità: dalla diagnosi alla prognosi e alla terapia. Vediamo subito un esempio dell'uso di questo calcolo per valutare l'impatto di un nuovo ipotetico farmaco su una malattia infettiva ignota.


2.1.3   L'analisi decisionale applicata alla clinica

Si era detto che l'attività del medico è intimamente connessa con la probabilità. In maniera non esplicita ciascun medico prende le sue decisioni pesando le conseguenze positive e negative che le decisioni stesse potrebbero avere per la salute del paziente. Negli ultimi decenni le decisioni cliniche sono state analizzate in maniera formale applicando tecniche già da tempo utilizzate in altri settori come quello industriale e quello militare. Questo tipo di analisi si basa proprio sugli stessi elementi di calcolo probabilistico definiti in questo capitolo.

L'analisi decisionale clinica è una tecnica che permette la quantificazione degli effetti di tutte le opzioni che stanno alla base di una certa decisione. La gran parte delle decisioni che prende il medico nella pratica quotidiana non sono decisioni semplici del tipo “scelta tra due opzioni A e B” in quanto le due opzioni hanno una serie più o meno ampia di conseguenze. L'analisi decisionale clinica esplicita l'intera gamma delle possibilità e le relative probabilità utilizzando gli alberi decisionali. Una volta che l'albero decisionale è stato costruito, si può attribuire a ogni evento la relativa probabilità (cioè la probabilità che l'evento si verifichi). Nell'albero decisionale possono essere anche incluse stime fatte dai pazienti circa il valore (positivo o negativo) che essi attribuiscono a un certo evento (queste stime vengono definite utilità). L'analisi decisionale può raggiungere alti gradi di complessità e applicarsi a tutti gli elementi dell'attività clinica: dalla diagnosi alla terapia.
La Figura 2.2 mostra un albero decisionale di una ipotetica situazione nella quale dobbiamo scegliere tra due opzioni terapeutiche, una delle quali (il trattamento B) è considerata innovativa e potenzialmente utile.

Immaginiamo che in una comunità insorga una ignota malattia infettiva e che la frequenza di questa malattia infettiva sia del 3% (0.03). Le prime esperienze di trattamento empirico vengono fatte con un antibiotico tradizionale, per esempio con l'amoxicillina che viene identificata come trattamento A (parte bassa del grafico). Successivamente si sperimenta un secondo farmaco, il trattamento B, che viene sempre usato in sequenza dopo il trattamento A. Nel grafico si noterà sulla sinistra un quadrato da cui si dipartono i tracciati che portano alle due decisioni terapeutiche (trattamento A e trattamento A seguito da trattamento B). Questo quadrato è un punto nodale del processo decisionale ed è definito nodo decisionale. La decisione dipende dal medico ed è il punto cruciale dell'albero. La scelta (A o A + B) apre una serie di possibili eventi (influenzati o meno dalla decisione) e a ciascuno di questi eventi sono attribuibili specifiche probabilità. Queste probabilità degli eventi si dipartono dai cerchi collocati a destra del nodo decisionale e si definiscono nodi di probabilità (chance nodes).

Partendo dal trattamento tradizionale, A, quando prendiamo la decisione di utilizzarlo generiamo 3 possibilità:
  1. il 3% (0.03) dei soggetti svilupperà la malattia
  2. il 2% dei casi (0.02), che sono persone sane che comunque non svilupperanno la malattia, manifesteranno importanti effetti collaterali
  3. la grande maggioranza (95%) dei soggetti non svilupperanno la malattia e non avranno effetti collaterali.
Tornando alla possibilità 1, i soggetti che svilupperanno la malattia avranno un'alta mortalità (80% o 0.8) e guariranno in una percentuale solo del 20% (0.2) (nota 2).

Se guardiamo l'ultima colonna a destra del grafico abbiamo ora una stima della probabilità di ciascuna di queste possibilità. La probabilità di guarigione dei pazienti che svilupperanno la malattia e che verranno trattati con A è pari allo 0.6% (0.006 o 6 individui su 1000) e la probabilità di morte è del 2.4% (0.024 o 24 individui su 1000). La probabilità di avere effetti indesiderati è del 2% (0.02 o 2 individui su 100) e la probabilità di sopravvivere senza contrarre la malattia e senza avere effetti collaterali è del 95% (o 0.95; 950 soggetti su 1000 hanno questa possibilità). Le probabilità dell'ultima colonna sono calcolate applicando la regola moltiplicatoria già descritta (0.03 malati x 0.2 guariti = 0.006; 0.03 malati x 0.8 morti = 0.024, ecc.).

Con il trattamento A la probabilità totale di sopravvivere è 0.976 (0.95 senza effetti collaterali + 0.020 con effetti collaterali, 0.006 dopo aver avuto la malattia ed essere guariti).

Il calcolo si sviluppa allo stesso modo anche nella parte alta del grafico che riguarda la decisione di trattare in sequenza i soggetti con il farmaco A e quindi con il farmaco B. L'albero decisionale qui include una possibilità ulteriore nel nodo probabilistico dei malati, cioè la possibilità che i malati trattati con il farmaco B (dopo il farmaco A) abbiano effetti collaterali dovuti al farmaco B. Si noterà che la probabilità di guarigione è qui più alta (0.4). Dall'ultima colonna si può calcolare che la probabilità totale di sopravvivere con il trattamento A+B è 0.985 (0.95 senza effetti indesiderati, 0.020 con effetti indesiderati del trattamento A, 0.003 con effetti indesiderati del trattamento B e 0.012 di sopravvivere dopo aver avuto la malattia ed essere guariti).

Questo albero decisionale indica che il guadagno che si ottiene passando dalla strategia A alla A+B è 0.976 - 0.985 = - 0.009. In altri termini la strategia A+B, rispetto al trattamento tradizionale A, salva 9 individui su 1000 trattati. Può sembrare un piccolo guadagno ma in realtà è un guadagno dell'ordine che si osserva nel trattamento dell'ipertensione lieve, ove il trattamento deve essere mantenuto indefinitamente. Questo esempio ha solo valore indicativo. Per arrivare alla decisione finale se trattare o no in maniera sistematica tutti i soggetti con la nuova strategia (A+B) altre considerazioni entreranno in gioco: la gravità degli effetti collaterali, la percezione del problema da parte del paziente [in questo caso il paziente sarebbe quasi certamente disposto a correre un rischio aggiuntivo (rispetto al trattamento tradizionale A) di eventi indesiderati dello 0.003 (o 3‰) per ottenere un aumento della probabilità di guarigione dello 0.006 (o 6‰)] e i costi. Se il trattamento B è particolarmente costoso esso potrebbe finire con l'assorbire una parte importante delle risorse destinate alla prevenzione sottraendole ad altre malattie.

I nefrologi possono trovare esempi molto intriganti di analisi decisionale clinica applicata a vari problemi, come la scelta dei filtri di dialisi (1), la necessità di trattare o non trattare i pazienti con glomerulonefrite membranosa (2) o le strategie sull'uso di eritropoietina (3), la biopsia renale nella sindrome nefrosica (4) e altri.


Bibliografia
  1. Hornberg JC. The hemodialysis prescription and quality-adjusted life expectancy. J Am Soc Nephrol 1993; 4: 1004-1027.
  2. Piccoli A, Pillon L, Passerini P, Ponticelli C. Therapy for idiopathic membranous nephropathy: tailoring the choice by decision analysis. Kidney Int 1994; 45: 1193-1202.
  3. Levey AS, Lau J, Pauker SG, Kassirer JP. Idiopathic nephrotic syndrome. Puncturing the biopsy myth. Ann Intern Med 1987; 107: 697-713.
  4. Piccoli A, Puggia RM, Fusaro M, Favaro E, Pillon L. A decision analysis comparing three dosage regimens of subcutaneous epoietin in continuous ambulatory peritoneal dialysis. PharmacoEconomics 1995; 7: 444-456.

Ulteriori letture

La probabilità è discussa in maniera esauriente su:

Un libro in cui è presentato in maniera dettagliata l'approccio bayesiano è:

Per chi volesse iniziare subito con l'analisi decisionale è consigliabile un libro introduttivo molto accattivante.

Assieme al libro viene distribuito un dischetto che consente al lettore di cimentarsi con problemi di bassa complessità.



Sull'analisi decisionale un programma statistico che soddisfa anche i palati più difficili (per la sua chiarezza e completezza) è il:

Letture di articoli recenti ben fatti che focalizzano l'attenzione sull'approccio probabilistico ai problemi clinici:



Note

1 è bene qui sottolineare ulteriormente la differenza tra eventi indipendenti ed eventi condizionati. Se il fumo e l’ipertensione fossero eventi indipendenti, la probabilità che un iperteso sia fumatore sarebbe 0.20 x 0.40 = 0.08, cioé molto più bassa.

2 Guarigione e morte sono due probabilità complementari. Se la probabilità di morte, p(A), è 0.8, la probabilità di guarigione è 1 - p(A), cioé 0.2.


Indietro   Inizio pagina   Avanti