Modèles multiniveaux
Principe
La modélisation de comportements individuels peut être effectuée non seulement en fonction de caractéristiques individuelles, mais aussi de données contextuelles qui vont influencer de manière similaire tous les individus soumis au même contexte.
L’analyse multiniveau, dans ce cadre, vise à s’affranchir de l’erreur écologique (erreur qui consisterait à interpréter au niveau individuel les résultats d’une modélisation effectuée à un niveau agrégé) et de l’erreur atomiste (ignorer le contexte dans lequel évolue l’individu et étendre à la dimension du contexte un ensemble d’effets individuels).
On distinguera les modèles à constante aléatoire (l’effet des variables explicatives est le même dans chacun des contextes, seul change l’effet moyen de chaque contexte par rapport à l’ensemble), et les modèles à pente aléatoire ou l’effet d’une variable est considéré différent selon l’unité contextuelle analysée. Ne pas prendre en compte un effet multiniveau revient notamment à sous-estimer la variance des effets contextuels, et donc surestimer leur significativité.
Ces méthodes ont été initiées et développées notamment dans les sciences de l’Education (Goldstein, 1995), où la notation d’un élève dépend non seulement de ses caractéristiques, mais aussi de paramètres propres à son environnement scolaire (professeur, classe). Elles ont fait l’objet de nombreuses publications en démographie (Courgeau, 2004), (Courgeau et Baccaïni, 1997).
Type de données analysées
Des données contextuelles seront intégrées aux variables explicatives lors de la modélisation, soit exogènes (provenant d’une source administrative distincte), soit endogènes (calcul de proportion sur une région par exemple à partir des données individuelles d’enquête).
Applications logicielles
La mise en œuvre à partir du logiciel Sas® se fait via la procédure mixed dans le cadre linéaire, les procédures glimmix et nlmixed dans le cadre non linéaire.
Le logiciel Stata® possède plusieurs fonctions permettant de mettre en œuvre les modèles à effets aléatoires (xtmixed dans le cadre linéaire, xtmelogit et xtpoisson par exemple dans le cadre non linéaire).
Les packages lme4 (cadre linéaire) et nlme4 (cadre non linéaire) permettent quant à eux la mise en œuvre dans le cadre du logiciel R.