Il libro
5   LA CURA
5.3   MISURE RIPETUTE NEL TEMPO: L’AGGIUSTAMENTO PER LA REGRESSIONE VERSO LA MEDIA



Quando si selezionano individui perché presentano valori estremi di un certo parametro è quasi certo che ripetendo l’osservazione i secondi valori saranno meno estremi e più vicini alla media del parametro nella popolazione. Il fenomeno della "regressione verso la media" è stato descritto da Galton nel 1886 (1). Galton notò che la media dell’altezza dei figli era identica alla media dell’altezza media dei due genitori ma che i figli dei genitori più alti erano più bassi dei loro genitori e viceversa (Figura 5.4). Egli pensò che questo rapporto avesse un ben preciso significato biologico e lo definì "Regression towards Mediocrity in Hereditary Stature". L’interpretazione del fenomeno non era corretta. La regressione verso la media non era una stranezza genetica ma era dovuta al fatto che l’altezza dei due genitori era la media di due valori e per questo era una stima più precisa dell’altezza rispetto a quella dei figli (una sola misura) (nota 2). In altri termini, la media dell’altezza dei due genitori è meno variabile rispetto all’altezza (individuale) dei figli. Nella Figura 5.4 il range dell’altezza dei figli (la freccia verticale) è infatti molto più ampio di quella dei genitori (freccia orizzontale). Questo fa sì che ai valori più alti dei genitori corrispondano valori relativamente più bassi dei figli e viceversa. In dettaglio, nella Figura 5.4 è evidente che a coppie di genitori con un’altezza media (padre + madre/2) di circa 182 cm corrisponde un figlio di 178 cm mentre a genitori di 166 cm corrisponde un figlio alto 170 cm. Un altro modo di immaginare il fenomeno è quello riportato nella Figura 5.5.
La distribuzione dei valori dei figli ha una maggior dispersione rispetto al valore medio dei due genitori (il range è più largo). Tuttavia se rimisuriamo i figli e calcoliamo la media della prima e della seconda misurazione, la variabilità dell’altezza dei figli si riduce e tende a diventare sovrapponibile a quella della misura media dei due genitori (la variabilità delle medie è inferiore a quella dei dati individuali).

I medici si confrontano quotidianamente con questo fenomeno: di fronte a risultati troppo alti o troppo bassi di un certo test essi ripetono il test una seconda volta. Ripetendo il test quasi sempre si nota che i nuovi risultati sono meno "anormali" dei precedenti.

È ovvio che tanto più estremo è il risultato del test tanto è meno probabile che esso risulti normale quando viene ripetuto.
Un esempio classico di regressione verso la media è quello della diagnosi di ipertensione. Alcuni pazienti che classifichiamo come ipertesi a una prima visita (soglia di normalità per la sistolica = 140 mmHg) sono meno ipertesi quando li riesaminiamo una seconda volta. Il fenomeno è presentato graficamente nella Figura 5.6. La "vera" pressione sistolica è la media di un numero elevato di rilevazioni (in teoria un numero infinitamente alto) che si colloca al centro di un range di valori più o meno ampio che definisce la variabilità pressoria individuale. Alcuni dei pazienti che sono più vicini alla soglia (140 mmHg) alla seconda visita presentano valori che sono al disotto della soglia stessa in quanto il range delle loro variazioni pressorie incrocia la linea di cut-off. Viceversa i pazienti con valori più elevati rimangono ben al di là della soglia anche alle misurazioni successive.


5.3.1   Come si può stimare la regressione verso la media

La regressione verso la media (RVM) può essere calcolata agevolmente (2). Applichiamo il calcolo per stimare la RVM della pressione sistolica in un paziente di 36 anni. La pressione sistolica nella popolazione di età compresa tra 35 e 40 anni ha una distribuzione normale con media m = 124 mmHg e deviazione standard s = 15 mmHg.
Sappiamo (esempio Figura 5.7) che il coefficiente di regressione (r) di due serie di misurazioni pressorie ripetute in due visite separate è uguale a 0.71 (nota 3). Per effettuare il calcolo dobbiamo “standardizzare” il cut-off (k) esprimendolo come deviazione dalla media standardizzata:

z = (k - m)/s


cioè (140 - 124)/15 = 1.07. Se consultiamo una tavola statistica (Tabella B, in Appendice) che riporta il rapporto (c) tra l’ordinata della distribuzione normale che coincide col valore di z = 1.07 e il valore dell’area sotto la curva della distribuzione normale per valori superiori a z = 1.07, troviamo che il valore di questo rapporto (c) è 1.58.

Possiamo ora calcolare la regressione verso la media (RVM) attesa che è:

RVM = c x s (1-r)


Nel nostro caso: 1.58 x 15 (1-0.71) = 6.87 mmHg. Quindi se selezioniamo pazienti con pressione sistolica >140 mmHg e un coefficiente di correlazione tra misure ripetute della pressione sistolica di 0.71, la misurazione pressoria della seconda visita è mediamente 6.87 mmHg più bassa di quella della prima visita. Se il coefficiente di correlazione fosse stato più basso, per esempio 0.50, la RVM sarebbe stata ancor più alta (11.85 mmHg). La RVM sarebbe stata più alta anche se avessimo scelto un cut-off più estremo (verificarlo è semplice, basta ripetere il calcolo con un altro valore di cut-off, per esempio 160 mmHg). La regressione verso la media dipende quindi dalla correlazione che esiste tra la prima misurazione e la successiva e dal valore di cut-off.

Se la correlazione è bassa e/o se si sceglie un valore di cut off estremo la RVM è alta e viceversa. La regressione verso la media, fin qui esemplificata con la pressione arteriosa, si ha con qualsiasi tipo di misurazione clinica. Per esempio con rilevazioni biochimiche come la colesterolemia o la glicemia o con misure fisiche come il peso corporeo. Con alcune misure, come il peso corporeo, la RVM è bassa. Per esempio il peso corporeo di un uomo di media età, alto 1.70 m è in media circa 70 Kg (deviazione standard circa 7 Kg). Sappiamo che l’accordo tra due serie di misure del peso è molto alto (perché il peso corporeo è una misura molto più stabile della pressione arteriosa), r = 0.9, quindi (1–r) =0.1. Se noi fissiamo un cut-off clinico di 84 Kg per definire l’eccesso ponderale, il valore di z è (84 – 70)/7 = 2. Il valore di c corrispondente è 2.37 e la RVM è 2.37 x 0.1, cioè solo 0.237 Kg.


5.3.2   Importanza della regressione verso la media

Il fenomeno della RVM è importante sia dal punto di vista clinico che dal punto vista scientifico. Il medico in genere prende le decisioni diagnostiche e formula i suoi programmi di terapia quando osserva valori al di sopra o al di sotto di una certa soglia. Per esempio egli considera ipercolesterolemici i pazienti con colesterolemia >200 mg/dl o ipertesi quelli con pressione arteriosa >140/90 mmHg. Nei processi decisionali (diagnosi/terapia) è necessario essere pienamente consapevoli che alcuni individui che presentano valori oltre la soglia si ricollocano al di sotto della soglia quando la misura viene ripetuta. Questo fenomeno, di natura puramente statistica, non ha nulla a che vedere con il miglioramento dello stato di malattia. Nell’attività clinica il problema della regressione verso la media si risolve col buon senso. Quando ci troviamo di fronte a valori estremi di un certo parametro clinico (molto alti o molto bassi) acquisiamo un buon grado di certezza circa una certa conclusione diagnostica e decidiamo di iniziare il trattamento. Questo dipende dal fatto che sappiamo che è molto improbabile che valori estremi risultino normali a una seconda misurazione. Per esempio in un paziente che ha una glicemia a digiuno di 200 mg/dl è quasi certamente classificabile come diabetico e dovrà per questo iniziare una forma di trattamento (dieta e/o farmaci). D’altra parte quando osserviamo valori marginalmente elevati (per esempio 124 mg/dl) ripetiamo più volte la misurazione della glicemia e classifichiamo i pazienti come diabetici solo quando la glicemia a digiuno si conferma stabilmente superiore a 120 mg/dl.

È importante sottolineare che la RVM è un fattore confondente negli studi clinici. Essa infatti si somma all’effetto dell’intervento producendo una sovrastima del risultato dell’intervento stesso. Se somministriamo un farmaco anti-ipertensivo a pazienti con pressione sistolica >140 mmHg, osserviamo un calo pressorio che è uguale alla somma della RVM (6.87 mmHg, vedi esempio precedente) più il “vero” effetto del farmaco. Nei trial clinici controllati che mettono a confronto l’effetto di un farmaco con quello di un placebo la differenza di risposta tra i due cancellerà l’influenza della RVM perché questa è presente sia nel primo caso (farmaco) che nel secondo (placebo). Pertanto gli studi clinici controllati eliminano l’errore di stima dell’effetto del farmaco causato dalla RVM. Tuttavia né questo né altri disegni sperimentali possono prevenire gli errori di selezione dei pazienti derivanti dal fenomeno RVM. Se decidiamo di studiare l’effetto di un farmaco ipotensivo nei pazienti con pressione sistolica >140 mmHg e selezioniamo i pazienti sulla base della misurazione pressoria di una sola visita, alcuni di questi pazienti alla seconda visita, in maniera del tutto indipendente dal trattamento ricevuto (farmaco o placebo), avranno una sistolica <140 mmHg. Questi pazienti in realtà non sono ipertesi e sono stati quindi inclusi erroneamente nello studio. Un modo per ridurre la RVM nei trial clinici è quello di selezionare i pazienti non sulla base di 1 sola misurazione ma di più misurazioni. Abbiamo più volte sottolineato il concetto che le misure medie sono meno variabili delle misure individuali: riducendo la variabilità riduciamo anche la RVM. Ripetere le misurazioni basali è il miglior sistema per minimizzare la regressione verso la media e per prevenire gli errori di selezione causati dalla RVM. Tre misurazioni basali producono una sostanziale riduzione della RVM ed è stato stimato che c’è solo un’ulteriore modesta riduzione quando si effettuano >3 misurazioni basali (2).


Bibliografia
  1. Citato da Bland JM e Altman DG. In: Regression towards the mean. BMJ 1994; 308: 1499.
  2. Yudkin PL and Stratton IM. How to deal with regression to the mean in intervention studies. Lancet 1996; 347: 241-243.


Note

2 Nel Capitolo 2.1 abbiamo visto infatti che la variabilità delle medie è inferiore alla variabilità dei singoli dati.

3 Il coefficiente di regressione è una misura dell’accordo tra le due serie di rilevazioni.


Indietro   Inizio pagina   Avanti