Analyse biographique

Principe
Ces méthodes sont utilisées depuis de nombreuses années en épidémiologie, et ont été utilisées et adaptées à partir des années 1980 en démographie (Courgeau et Lelièvre, 1989). L’analyse des biographies permet de traiter des données longitudinales censurées. Ces données peuvent notamment être obtenues dans des enquêtes comportant un volet rétrospectif, décrivant l’histoire résidentielle, familiale ou professionnelle de l’individu. On peut alors étudier l’éventuelle survenue d’un évènement dans le cycle de vie d’un individu en fonction de ses caractéristiques.

On distinguera les méthodes non paramétriques, paramétriques, et semi-paramétriques. L’utilisation de méthodes non paramétriques permet notamment d’étudier la forme de la fonction de survie, et les différences dans le calendrier et l’intensité de survenue de l’évènement en fonction de variables de stratification. La méthode semi paramétrique (modèle de Cox) permet quant à elle d’effectuer une modélisation et de mesurer l’impact de variables explicatives, fixes ou dépendantes du temps, sur le quotient instantané. La méthode de régression logistique à temps discret permet, quant à elle, d’obtenir une modélisation sur un fichier individus-années dans le cas de données recueillies de manière discrète.

Applications logicielles
La mise en œuvre à partir du logiciel Sas® se fait via la procédure lifetest dans le cadre de méthodes non paramétriques, phreg dans le cadre de modèle de Cox, et lifereg dans le cadre de modèles paramétriques.
Le logiciel Stata® nécessite de prédéfinir par l’instruction stset la base de données de durée à analyser (définition de la variable de durée et de la condition de censure d’une observation). Une batterie de fonction permettent ensuite d’analyser de manière exploratoire et non paramétriques cette base de durée (stdes, sts list, sts graph …), et les modèles de Cox sont mis en œuvre par une instruction stcox, les modèles paramétriques par une instruction streg en définissant une distribution pour la fonction de survie.
Le package survival permet de mettre en œuvre ce type d’analyse dans le logiciel R.

Exemple de graphique
Le graphique suivant est publié dans l’ouvrage « Analyse Démographique des biographies » (Courgeau et Lelièvre, 1989) et illustre une utilisation des fonctions de séjour.

En savoir plus