-
Notifications
You must be signed in to change notification settings - Fork 6
/
Copy path320-ph.Rmd
596 lines (450 loc) · 25.2 KB
/
320-ph.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
# Pruebas de hipótesis {#ph}
En este capítulo se muestran las pruebas de hipótesis para comparar modelos mixtos.
## Prueba razón de verosimilitud
Supongamos que queremos estudiar $H_0: \boldsymbol{\theta} \in \boldsymbol{\Theta}_0$ versus $H_A: \boldsymbol{\theta} \in \boldsymbol{\Theta}$. La prueba razón de verosimilitud ($LR$) para $H_0$ está dada por:
$$
LR = -2 \log \left( \frac{ sup_{\theta \in \boldsymbol{\Theta}_0} L(\theta)}{ sup_{\theta \in \boldsymbol{\Theta}} L(\theta)} \right).
$$
Usualmente la prueba de razón de verosimilitud se expresa en función de los valores de log-verosimilitud del modelo así:
$$
LR = -2 ( l(\boldsymbol{\theta}_0) - l(\hat{\boldsymbol{\theta}}) ),
$$
y el estadístico $LR \sim \chi^2_{k-k_0}$, donde $k$ es el número de parámetros del modelo estimado y $k_0$ el número de parámetros del modelo asumiendo $H_0$ verdadera.
El vector $\boldsymbol{\theta}_0$ es el vector de parámetros asumiendo que $H_0$ es verdadera mientras que $\hat{\boldsymbol{\theta}}$ es el vector de parámetros del modelo más general.
## Prueba de Wald
Si el interés es estudiar $H_0: \beta_k = \beta_{k0}$ contra $H_A: \beta_k \neq \beta_{k0}$ se puede usar la prueba de Wald que tiene el siguiente estadístico:
$$
t = \frac{\hat{\beta}_k - \beta_{k0}}{se(\hat{\beta}_k)},
$$
donde $se(\hat{\beta}_k)$ corresponde al error estándar de la estimación $\hat{\beta}_k$, todo esto disponible en el summary del modelo ajustado. Si $H_0$ es verdadera, $t \sim t_{n-p}$, siendo $n$ el número de observaciones y $p$ el número de efectos fijos estimados (no el número de variables) en el modelo.
## Prueba de hipótesis sobre los efectos fijos
La prueba razón de verosimilitud puede ser usada para comparar modelos ajustados por el método ML y que difieran en su estructura de efectos fijos, pero con la mismas componentes de varianza. Los valores-P de la prueba pueden ser anticonservativos, es decir, más pequeños de lo normal y por lo tanto se podría rechazar $H_0$ más fácilmente [@PinhieroBates2000]. En lugar de usar la distribución $\chi^2$ para el estadístico de la prueba razón de verosimilitud, se recomienda usar la distribución empírica del estadístico, obtenida al ajustar los modelos nulo y alternativo con múltiples conjuntos de datos simulados [@Galecki2012].
### Ejemplo {-}
```{r echo=FALSE, out.width="80%", fig.align='center'}
knitr::include_graphics("images/chicks_growth.png")
```
La base de datos `ChickWeight` contiene información sobre el peso de un grupo de pollos versus el tiempo bajo diferentes dietas. Abajo una ilustración de los datos.
```{r plot_ChickWeight, fig.height=10, fig.width=10}
library(ggplot2)
ggplot(data = ChickWeight, aes(x = Time, y = weight, color = Diet)) +
geom_point() +
theme_bw() +
facet_wrap(~ Chick)
```
El objetivo es comparar los siguientes dos modelos.
Modelo 1
\begin{align*}
Weight_{ij} &\sim N(\mu_{ij}, \sigma^2_{weight}) \\
\mu_{ij} &= \beta_0 + \beta_1 tiempo_{ij} + b_{0i} \\
b_{0} &\sim N(0, \sigma^2_{b0})
\end{align*}
Modelo 2
\begin{align*}
Weight_{ij} &\sim N(\mu_{ij}, \sigma^2_{weight}) \\
\mu_{ij} &= \beta_0 + \beta_1 tiempo_{ij} + \beta_2 dieta2_{i} + \beta_3 dieta3_{i} + \beta_4 dieta4_{i} + b_{0i} \\
b_{0} &\sim N(0, \sigma^2_{b0})
\end{align*}
<div style="-moz-box-shadow: 1px 1px 3px 2px #000000;
-webkit-box-shadow: 1px 1px 3px 2px #000000;
box-shadow: 1px 1px 3px 2px #000000;">
```{block2, type='rmdexercise'}
Solución.
```
</div>
El problema de este ejercicio se puede resumir con $H_0:$ la variable Dieta no aporta al modelo, versus, $H_A:$ la variable Dieta si aporta al modelo.
Para ajustar ambos modelos se usa el siguiente código.
```{r}
library(nlme)
mod1 <- lme(weight ~ Time, data = ChickWeight, random = ~ 1 | Chick, method='ML')
mod2 <- lme(weight ~ Time + Diet, data = ChickWeight, random = ~ 1 | Chick, method='ML')
```
Para calcular la prueba razón de verosimilitud se usa el siguiente código.
```{r}
lrt <- -2 * (logLik(mod1) - logLik(mod2))
lrt
pchisq(q=lrt, df=7-4, lower.tail=FALSE)
```
De la salida anterior se tiene que el valor-P = 0.000660304 y menor que cualquier $\alpha$. Sin embargo, como este valor-P puede ser "anticonservativo" (más pequeño de lo que debería ser), es mejor no sacar conclusiones apresuradas y rechazar $H_0$.
La prueba de verosimilitud se puede obtener también así:
```{r}
anova(mod1, mod2)
```
Para obtener un valor-P más acorde al problema podemos usar simulación. La función `simulate.lme` simula datos de modelos especificados por medio de los argumentos `object` y `m2`, ajusta los modelos, y entrega los valores de log-verosimilitud, con los se puede obtener el estadístico de la prueba de razón de verosimilitud. A continuación el código para obtener el valor-P con simulación.
```{r, eval=FALSE}
simul <- simulate.lme(object=mod1, m2=mod2, method = 'ML', nsim=1000)
lrts_nlme <- -2 * (simul$null$ML[, 2] - simul$alt$ML[, 2])
acumulada1 <- ecdf(x=lrts_nlme) # F(x) para los valores LRT
1 - acumulada1(17.14349)
```
```{r, echo=FALSE}
0.001
```
De la salida anterior se tiene que el valor-P = 0.001 y ya no es tan pequeño como el valor-P anterior. Por esta razón hay evidencias rechazar $H_0$ y por lo tanto la variable Dieta si aporta al modelo.
### Ejemplo {-}
```{r echo=FALSE, out.width="40%", fig.align='center'}
knitr::include_graphics("images/orthdontic_measurement.png")
```
La base de datos `Orthodont` contiene información sobre una medida de distancia intrafacial para jóvenes sometidos a ortodoncia.
```{r plot_Orthodont, fig.height=6, fig.width=8}
data(Orthodont, package="nlme")
library(ggplot2)
ggplot(data = Orthodont, aes(x = age, y = distance, color = Sex)) +
geom_point() +
theme_bw() +
facet_wrap(~ Subject)
```
El objetivo es comparar los siguientes dos modelos.
Modelo 1
\begin{align*}
Distance_{ij} &\sim N(\mu_{ij}, \sigma^2_{distance}) \\
\mu_{ij} &= \beta_0 + \beta_1 age_{ij} + b_{0i} \\
b_{0} &\sim N(0, \sigma^2_{b0})
\end{align*}
Modelo 2
\begin{align*}
Distance_{ij} &\sim N(\mu_{ij}, \sigma^2_{distance}) \\
\mu_{ij} &= \beta_0 + \beta_1 age_{ij} + \beta_2 SexFemale_i + b_{0i} \\
b_{0} &\sim N(0, \sigma^2_{b0})
\end{align*}
<div style="-moz-box-shadow: 1px 1px 3px 2px #000000;
-webkit-box-shadow: 1px 1px 3px 2px #000000;
box-shadow: 1px 1px 3px 2px #000000;">
```{block2, type='rmdexercise'}
Solución.
```
</div>
El problema de este ejercicio se puede resumir con $H_0:$ la variable Sexo no aporta al modelo, versus, $H_A:$ la variable Sexo si aporta al modelo.
Para ajustar ambos modelos se usa el siguiente código.
```{r}
library(lme4)
mod1 <- lmer(distance ~ age + (1|Subject), data=Orthodont, REML=FALSE)
mod2 <- lmer(distance ~ age + Sex + (1|Subject), data=Orthodont, REML=FALSE)
```
Para calcular la prueba razón de verosimilitud se usa el siguiente código.
```{r}
lrt <- -2 * (logLik(mod1) - logLik(mod2))
lrt
pchisq(q=lrt, df=5-4, lower.tail=FALSE)
```
De la salida anterior se tiene que el valor-P = 0.003487534 y menor que cualquier $\alpha$. Sin embargo, como este valor-P puede ser "anticonservativo" (más pequeño de lo que debería ser), es mejor no sacar conclusiones apresuradas y rechazar $H_0$.
La prueba de verosimilitud se puede obtener también así:
```{r}
anova(mod1, mod2)
```
Para obtener un valor-P más acorde al problema podemos usar simulación. La función `simulate.lme` simula respuestas $y_{ij}$ del modelo dado. A continuación el código para obtener el valor-P con simulación (¡tarda varios minutos!).
```{r, eval=FALSE}
nrep <- 5000
lrts_lme4 <- numeric(nrep)
for (i in 1:nrep) {
new_y_h0 <- simulate(mod1) # Asumiendo H0 verdadera
Orthodont$new_y_h0 <- new_y_h0$sim_1
aux0 <- lmer(new_y_h0 ~ age + (1|Subject), data=Orthodont, REML=FALSE)
aux1 <- lmer(new_y_h0 ~ age + Sex + (1|Subject), data=Orthodont, REML=FALSE)
lrts_lme4[i] <- -2 * (logLik(aux0) - logLik(aux1))
}
acumulada2 <- ecdf(x=lrts_lme4) # F(x) para los valores LRT
1 - acumulada1(8.533057)
```
```{r, echo=FALSE}
0.005
```
De la salida anterior se tiene que el valor-P = 0.005 y ya no es tan pequeño como el valor-P anterior. Por esta razón hay evidencias rechazar $H_0$ y por lo tanto la variable Sexo si aporta al modelo.
## Prueba de hipótesis sobre componentes de varianza
Las componentes de varianza corresponden a las varianzas y covarianzas del vector de efectos aleatorios. La prueba razón de verosimilitud puede ser usada para comparar modelos ajustados por el método REML y que difieran en sus componentes de varianza, pero que tenga igual estructura de efectos fijos.
Para hacer pruebas de hipótesis sobre las componentes de varianza se tienen dos casos que se explican en las siguientes subsecciones.
### Componentes de varianza lejos del borde
Luego un ejemplo.
### Componentes de varianza en el borde
Este caso se presenta cuando la hipótesis nula considera que uno o varios parámetros están justo en el borde del dominio del parámetro en cuestion. Por ejemplo, si queremos estudiar la inclusión del intercepto aleatorio $b_0$ en un modelo de regresión clásico, tendríamos las siguientes hipótesis: $H_0: \sigma^2_{b0} = 0$ versus $H_A: \sigma^2_{b0} > 0$. Debido a la condición de $\sigma^2_{b0}$ en $H_0$, se dice que esa componente de varianza está en el borde de su dominio, ya que $\sigma^2_{b0}$ no puede ser negativa. En este ejemplo particular, rechazar $H_0$ implicaría que es apropiado incluir $b_0$ en el modelo.
En el caso de componentes de varianza cerca de la frontera la distribución del estadístico razón de verosimilitud no es exactamente una $\chi^2$ [@Galecki2012]. En la sección 6.3.4 de [@Verbeke2000] se listan cuatro casos en los cuales se usan mezclas de distribuciones corregir la distribución del estadístico y así calcular el valor-P corregido en la prueba razón de verosimilitud. Los cuatro casos son los siguientes:
- Sin efecto aleatorio versus 1 efecto aleatorio: en este caso lo que interesa es $H_0: \sigma^2_{b} = 0$ versus $H_A: \sigma^2_{b} > 0$, la distribución asintótica del estadístico de razon de verosimilitud es una mezcla de $\chi^2_1$ y $\chi^2_0$ con pesos iguales a 0.5.
- 1 efecto aleatorio versus 2 efectos aleatorios: en este caso lo que interesa es $H_0: \boldsymbol{D} =
\begin{pmatrix} d_{11} & 0 \\
0 & 0
\end{pmatrix}$
versus $H_A: \boldsymbol{D} \neq \boldsymbol{0}$ para un $d_{11}>0$, en este caso la distribución asintótica del estadístico razón de verosimilitud es una mezcla de $\chi^2_2$ y $\chi^2_1$ con pesos iguales a 0.5.
- $q$ efectos aleatorios versus $q+1$ efectos aleatorios: en este caso lo que interesa es
$H_0: \boldsymbol{D} =
\begin{pmatrix}
\boldsymbol{D_{11}} & \boldsymbol{0}\\
\boldsymbol{0}^\top & 0
\end{pmatrix}$
donde $\boldsymbol{D_{11}}$ es una matriz de covarianzas (positiva definida) de dimensión $q \times q$ versus que $\boldsymbol{D}$ es una matriz general de dimensión $q+1 \times q+1$. En este caso la distribución asintótica del estadística razón de verosimilitud es una mezcla de $\chi^2_{q+1}$ y $\chi^2_q$ con pesos iguales a 0.5.
- $q$ efectos aleatorios versus $q+k$ efectos aleatorios: en este caso lo que interesa es
$H_0: \boldsymbol{D} =
\begin{pmatrix}
\boldsymbol{D_{11}} & \boldsymbol{0}\\
\boldsymbol{0}^\top & \boldsymbol{0}
\end{pmatrix}$
donde $\boldsymbol{D}$ es una matriz de covarianzas (positiva definida) de dimensión $q+k \times q+k$ versus que
$H_A: \boldsymbol{D} =
\begin{pmatrix}
\boldsymbol{D_{11}} & \boldsymbol{D_{12}}\\
\boldsymbol{D_{12}}^\top & \boldsymbol{D_{22}}
\end{pmatrix}$
es una matriz general de dimensión $q+k \times q+k$. En este caso la distribución asintótica del estadística razón de verosimilitud es una mezcla de $\chi^2_{q+k}$ y $\chi^2_q$ con pesos iguales a 0.5.
Si la distribución nula del estadístico razón de verosimilitud no puede ser obtenida analíticamente, una posible solución es usar la distribución empírica del estadístico obtenida al ajustar múltiples modelos nulos y alternativos [@Galecki2012].
### Ejemplo {-}
Simule 10 observaciones para cada uno de los 10 grupos siguiendo el siguiente modelo y luego aplique la prueba de razón de verosimilitud para estudiar $H_0: \sigma^2_{b0} = 0$ versus $H_A: \sigma^2_{b0} > 0$.
\begin{align*}
y_{ij} &\sim N(\mu_{ij}, \sigma^2_y) \\
\mu_{ij} &= 4 - 6 x_{ij} + b_{0i} \\
\sigma^2_y &= 4 \\
b_{0} &\sim N(0, \sigma^2_{b0}=4) \\
x_{ij} &\sim U(0, 10)
\end{align*}
<div style="-moz-box-shadow: 1px 1px 3px 2px #000000;
-webkit-box-shadow: 1px 1px 3px 2px #000000;
box-shadow: 1px 1px 3px 2px #000000;">
```{block2, type='rmdexercise'}
Solución.
```
</div>
La función `gen_dat_b0` de abajo permite simular `m` observaciones de `n` grupos con intercepto aleatorio $b_0 \sim N(0, \sigma^2_{b0})$. Adicionalmente, es posible elegir los efectos fijos `beta0`, `beta_1` y la varianza `sigma` de la variable respuesta.
```{r}
gen_dat_b0 <- function(n, m, beta0, beta1, sigmay, sigmab0, seed=NULL) {
if(is.null(seed)) seed <- as.integer(runif(1)*2e9)
group <- rep(1:n, each=m)
set.seed(seed)
b0 <- rep(rnorm(n=n, mean=0, sd=sigmab0), each=m)
set.seed(seed)
x <- runif(n=n*m, min=0, max=10)
set.seed(seed)
y <- rnorm(n=n*m, mean=beta0 + beta1 * x + b0, sd=sigmay)
data.frame(group=group, x=x, y=y)
}
```
Vamos ahora a generar 10 observaciones para 10 grupos con intercepto aleatorio con una varianza $\sigma^2_{b0}=2^2=4$. La semilla se va a fijar en un valor de 1220872376 por cuestiones didácticas.
```{r}
datos <- gen_dat_b0(n=10, m=10,
beta0=4, beta1=-6,
sigmay=2, sigmab0=2, seed=1220872376)
head(datos)
```
Vamos a ajustar dos modelos, el primero sin incluir $b_0$ y el segundo incluyendo $b_0$.
```{r}
library(nlme)
fit1 <- gls(y ~ x, data=datos, method="REML") # Igual resultado con lm
fit2 <- lme(y ~ x, random = ~ 1| group, data=datos, method="REML")
```
Resultados del primer modelo.
```{r}
summary(fit1)
```
Resultados del segundo modelo.
```{r}
summary(fit2)
```
Ahora vamos a calcular el estadístico y su valor-P.
```{r}
lrt <- -2 * (logLik(fit1) - logLik(fit2))
lrt
p_value <- pchisq(q=3.04712, df=1, lower.tail=FALSE)
p_value
```
De la salida anterior se tiene que $valor-P = 0.0809$ y como $\alpha=0.05$, por lo tanto NO hay evidencias para rechazar $H_0: \sigma^2_{b0} = 0$. ¿No es extraña esta conclusión 🤔?
Lo anterior ocurre porque la distribución del estadístico $LR$ no es un $\chi^2$ sino una mezcla de distribuciones $\chi^2_1$ y $\chi^2_0$ con pesos iguales a 0.5. A continuación vamos a mostrar la distribución de $LR$ en este ejemplo.
```{r}
library(emdbook) # Para usar la función dchibarsq
library(ggplot2)
ggplot(data = data.frame(x = 0), mapping = aes(x = x)) +
stat_function(fun = dchibarsq, args = list(df = 1)) +
xlim(0, 5)
```
Para calcular el valor-P de la prueba hacemos
```{r}
pchibarsq(p=3.04712, df = 1, mix = 0.5, lower.tail=FALSE)
```
También es posible obtener el valor-P usando simulación. Vamos a simular 50 conjuntos de datos suponiendo $H_0$ verdadera y luego calcularemos los `lrt` para así tener la distribución empírica de los `lrt` bajo la hipótesis nula $H_0: \sigma^2_{b0} = 0$ verdadera. En un aplicación se deberían generar más conjuntos de pero aquí vamos a usar sólo 50 por comodidad.
```{r}
pseudo_gen_dat <- function(nobs, beta0, beta1, sigmay) {
group <- datos$group # Aqui la diferencia
x <- datos$x # Aqui la diferencia
y <- rnorm(n=nobs, mean=beta0 + beta1 * x, sd=sigmay)
data.frame(group=group, x=x, y=y)
}
nrep <- 50
lrts <- numeric(nrep)
for (i in 1:nrep) {
pseudo_datos <- pseudo_gen_dat(nobs=100, beta0=4.64931,
beta1=-6.00175, sigma=2.50842)
m1 <- gls(y ~ x, data=pseudo_datos, method="REML")
m2 <- lme(y ~ x, random = ~ 1| group, data=pseudo_datos, method="REML")
lrts[i] <- -2 * (logLik(m1) - logLik(m2))
}
```
Dibujando la densidad de los `lrt`.
```{r dist_empirica_lrts}
plot(density(lrts), main='Densidad empírica de los lrts')
```
Calculando el valor-P.
```{r}
acumulada <- ecdf(x=lrts) # F(x) para los valores LRT
1 - acumulada(3.04712) # Valor-P
```
De la salida anterior se tiene que $valor-P < \alpha$ por lo tanto SI hay evidencias para rechazar $H_0: \sigma^2_{b0} = 0$. ¿Es esto coherente ahora 🙂?
<div style="-moz-box-shadow: 1px 1px 3px 2px #808080;
-webkit-box-shadow: 1px 1px 3px 2px #808080;
box-shadow: 1px 1px 3px 2px #808080;">
```{block2, type='rmdwarning'}
Los resultados anteriores se obtuvieron usando `nrep <- 50`, en la práctica ese número de repeticiones debería subir al menos a 1000. Repita el procedimiento anterior con `nrep <- 5000` y observe lo que sucede.
```
</div>
El paquete **RLRsim** de @R-RLRsim tiene la función `exactRLRT` que permite extraer el valor-P mediante simulación. Abajo un ejemplo de como usarla en el presente ejemplo.
```{r}
library(RLRsim)
exactRLRT(m=fit2, nsim=1000)
```
<div style="-moz-box-shadow: 1px 1px 3px 2px #00ffff;
-webkit-box-shadow: 1px 1px 3px 2px #00ffff;
box-shadow: 1px 1px 3px 2px #00ffff;">
```{block2, type='rmdtip'}
Consulte la ayuda de la función `exactRLRT` para que conozca sus posibilidades y limitaciones.
```
</div>
### Ejemplo {-}
Simule 10 observaciones para cada uno de los 10 grupos siguiendo el siguiente modelo y luego aplique la prueba de razón de verosimilitud para estudiar $H_0:$ el modelo con intercepto aleatorio está bien versus $H_A:$ se necesita intercepto y pendiente aleatoria.
\begin{align*}
y_{ij} &\sim N(\mu_{ij}, \sigma^2_y) \\
\mu_{ij} &= 4 - 6 x_{ij} + b_{0i} + b_{1i} x_{ij} \\
\sigma^2_y &= 4 \\
\left (
\begin{matrix}
b_{0} \\ b_{1}
\end{matrix}
\right ) &\sim
N\left ( \left ( \begin{matrix}
0 \\ 0
\end{matrix} \right ),
\left ( \begin{matrix}
\sigma^2_{b0}=10 & \sigma_{b01}=3 \\
\sigma_{b01}=3 & \sigma^2_{b1}=2
\end{matrix} \right )
\right ) \\
x_{ij} &\sim U(0, 10)
\end{align*}
<div style="-moz-box-shadow: 1px 1px 3px 2px #000000;
-webkit-box-shadow: 1px 1px 3px 2px #000000;
box-shadow: 1px 1px 3px 2px #000000;">
```{block2, type='rmdexercise'}
Solución.
```
</div>
La función `gen_dat_b0_b1` de abajo permite simular `m` observaciones de `n` grupos con intercepto y pendiente aleatoria según el modelo exigido.
```{r}
gen_dat_b0_b1 <- function(n, m, beta0, beta1,
sigma2y,
sigma2b0, sigma2b1, sigmab0b1,
seed=NULL) {
if(is.null(seed)) seed <- as.integer(runif(1)*2e9)
group <- rep(1:n, each=m)
Sigma <- matrix(c(sigma2b0, sigmab0b1,
sigmab0b1, sigma2b1), ncol=2, nrow=2)
set.seed(seed)
b <- MASS::mvrnorm(n=n, mu=c(0, 0),
Sigma=Sigma, empirical=TRUE)
b <- apply(X=b, MARGIN=2, rep, each=m)
b0 <- b[, 1] # Extrayendo los b0
b1 <- b[, 2] # Extrayendo los b1
set.seed(seed)
x <- runif(n=n*m, min=0, max=10)
mu <- beta0 + beta1 * x + b0 + b1 * x
set.seed(seed)
y <- rnorm(n=n*m, mean=mu, sd=sqrt(sigma2y))
data.frame(group=group, x=x, y=y)
}
```
Vamos ahora a generar 10 observaciones para 10 grupos con intercepto y pendiente aleatoria. La semilla se va a fijar en un valor de 1234 por cuestiones didácticas.
```{r}
datos <- gen_dat_b0_b1(n=10, m=10,
beta0=4, beta1=-6,
sigma2y=4,
sigma2b0=10, sigma2b1=2, sigmab0b1=3,
seed=1234)
head(datos)
```
Vamos a ajustar dos modelos, el primero sólo con $b_0$ y el segundo incluyendo $b_0$ y $b_1$.
```{r}
library(lme4)
fit0 <- lmer(y ~ x + (1 | group), data=datos, REML=TRUE)
fit1 <- lmer(y ~ x + (1 + x | group), data=datos, REML=TRUE)
```
Vamos a calcular ahora el valor del estadístico de la prueba razón de verosimilitudes así:
```{r}
lrt <- -2 * (logLik(fit0) - logLik(fit1))
lrt
```
Como la distribución del estadístico es una mezcla de distribuciones vamos a calcular el valor P de la siguiente manera.
```{r}
p_value <- 0.5 * (1-pchisq(lrt, 1)) + 0.5 * (1-pchisq(lrt, 2))
p_value <- as.numeric(p_value)
p_value # p-value from equal mixture chi_1^2:chi_2^2
```
De la salida anterior vemos que el valor-P es muy pequeño, eso significa que rechazamos $H_0$ y concluimos que el modelo con $b_0$ y $b_1$ es más apropiado que el modelo que tiene sólo intercepto aleatorio. La conclusión a la que llegamos es correcta porque así fue que generamos los datos.
Es posible obtener el valor-P anterior usando boostrap por medio de la función `PBmodcomp` del paquete **pbkrtest** de @R-pbkrtest.
```{r eval=FALSE}
library(pbkrtest)
PBmodcomp(largeModel=fit1, smallModel=fit0, nsim=1000, seed=123)
```
```{}
Bootstrap test; time: 21.86 sec; samples: 1000; extremes: 0;
Requested samples: 1000 Used samples: 999 Extremes: 0
large : y ~ x + (1 + x | group)
y ~ x + (1 | group)
stat df p.value
LRT 122.82 2 <2e-16 ***
PBtest 122.82 0.001 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
```
En el código anterior se usó la semilla `seed = 123` para simular los nuevos conjuntos de datos. De la salida anterior se observa que el valor-P es 0.001 con lo que se concluye que hay evidencias para rechazar $H_0$.
<div style="-moz-box-shadow: 1px 1px 3px 2px #ffff00;
-webkit-box-shadow: 1px 1px 3px 2px #ffff00;
box-shadow: 1px 1px 3px 2px #ffff00;">
```{block2, type='rmdnote'}
Para usar la función `PBmodcomp` es necesario que los modelos sean de la clase lme4. Consulte la ayuda de la función para más detalles.
```
</div>
## Ejercicios {-}
1. ¿Qué son modelos anidados? ¿Son modelos que usan datos relacionados con aves?
2. Considere la base de datos `sleepstudy` del paquete __lme4__. El objetivo es comparar los siguientes dos modelos.
Modelo 1
\begin{align*}
Reaction_{ij} &\sim N(\mu_{ij}, \sigma^2_{reaction}) \\
\mu_{ij} &= \beta_0 + \beta_1 days_{ij} + b_{0i} + b_{1i} days_{ij} \\
(b_0, b_1)^\top &\sim N(\boldsymbol{0}, \boldsymbol{D})
\end{align*}
Modelo 2
\begin{align*}
Reaction_{ij} &\sim N(\mu_{ij}, \sigma^2_{reaction}) \\
\mu_{ij} &= \beta_0 + \beta_1 days_{ij} + \beta_2 days_{ij}^2 + b_{0i} + b_{1i} days_{ij} \\
(b_0, b_1)^\top &\sim N(\boldsymbol{0}, \boldsymbol{D})
\end{align*}
Escriba las hipótesis del problema en forma simbólica y en lenguaje sencillo. Aplique la prueba razón de verosimilitud usando simulación y concluya. Rta: el valor-P $\approx$ 0.136.
3. Considere el ejemplo del capítulo \@ref(apli-nlme) sobre el estudio de crecimiento de un grupo de jóvenes. Aplique la prueba razón de verosimilitud para estudiar $H_0: \sigma^2_{b0} = 0$ versus $H_A: \sigma^2_{b0} > 0$, es decir, ajuste un modelo lineal simple para explicar la estatura en función de la edad y luego un modelo mixto con intercepto aleatorio. ¿Cuál de los dos modelos parece explicar mejor los datos? Use $\alpha=0.06$.
3. En este [enlace](https://stats.stackexchange.com/questions/161394/testing-the-variance-component-in-a-mixed-effects-model) está la pregunta de un usuario de StackExange sobre prueba de hipótesis (PH).
- ¿Fue la pregunta sobre PH sobre efectos fijos o PH sobre componentes de varianza?
- ¿Quería el usuario un PH asintótica o una PH basada en bootstrap (relacionado con simulación)?
- Mire el ejemplo que dió YaronZ, ¿por qué no definió el método REML dentro de las funciones `lmer` y `lm`?
4. En este [enlace](https://stats.stackexchange.com/questions/361681/mixed-effects-model-compare-random-variance-component-across-levels-of-a-groupi) está la extensa pregunta del usuario Patrick.
- En el primer cajón de código Patrick escribió un código para simular observaciones de un modelo mixto. ¿Cómo le parece esa forma de simular?
- ¿Cuántos elementos tiene el vector de parámetros del modelo de Patrick?
- ¿Cuáles son los valores de los parámetros?
5. En este [enlace](https://stats.stackexchange.com/questions/4858/how-to-test-random-effects-in-a-multilevel-model-in-r) está la pregunta del usuario biostat_newbie.
- ¿Qué nombre recibe el modelo que le interesa a biostat_newbie?
- ¿Qué es lo que necesita 0.7494974?
- ¿Cuál es el mensaje de primer párrafo de que respondió Fabians?
- En la respuesta que Fabians dió hay un código de R. ¿Para qué sirve ese código tan extraño?
6. ¿Quién es Ben Bolker? ¿En cuáles paquetes de R ha participado Ben Bolker?
7. En este [enlace](https://stats.stackexchange.com/questions/141746/comparing-mixed-effects-and-fixed-effects-models-testing-significance-of-random) está la pregunta del usuario user9171.
- ¿Cuál es el error que comete user9171 al usar el siguiente código?
```{r, eval=FALSE}
> anova(fit.fe, fit.me)
Error: $ operator not defined for this S4 class
```
- ¿Qué le respondió Karl Ove Hufthammer?
- Karl le agrega en su respuesta "And really the choice of whether to include the random effects should be based on theory (e.g., the sampling plan), not on a statistical test". ¿Qué quiere decir eso?
8. Ben Bolker escribió unas notas sobre pruebas de hipótesis, revise este [enlace](https://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#testing-significance-of-random-effects) para consultarlas.
- En el ejemplo de Ben Bolker hay tres modelos: `m2`, `m1` y `m0`. ¿Cuál es el "full model" y cuál es el "reduced model"?
- ¿Para qué sirve la función `update`? ¿Usted la ha usado alguna vez? ¿No? Pues úsela de aquí en adelante.
- Ben escribe "which has a fast implementation of simulation-based tests of null hypotheses about zero variances, for simple tests." ¿A qué paquete se refiere con esa frase?