L'orgue de barbarie : proposition d'une représentation des données de santé temps-dépendantes, visant à faciliter leur réutilisation. Chazard, E., Balaye, P., Balcaen, T., Genin, M., Cuggia, M., Bouzille, G., & Lamer, A. Revue d'Épidémiologie et de Santé Publique, 70:S8, March, 2022.
L'orgue de barbarie : proposition d'une représentation des données de santé temps-dépendantes, visant à faciliter leur réutilisation [link]Paper  doi  abstract   bibtex   
Introduction Les données structurées d'entrepôts de santé sont complexes (centaines de tables, variables qualitatives multivaluées, déséquilibrées, manquantes). L'extraction de caractéristique génère des données ressemblant aux données de questionnaires, aisément analysables. Trop souvent, elle écrase la temporalité des données. Objectif Proposer une méthodologie d'extraction de caractéristiques sécurisant la gestion du temps. Méthodes Analogie entre les partitions d'orgue de barbarie et les données de santé temps-dépendantes. Etude de compatibilité avec les données structurées fréquemment rencontrées (PMSI, médicaments, biologie médicale). Etude de compatibilité avec les méthodes statistiques d'analyse de données temps-dépendantes. Résultats Les partitions d'orgue de barbarie sont constituées de pistes représentant des notes, qui peuvent être actives (perforées) ou non. Ces pistes synchronisées défilent et jouent une musique. Pareillement, un patient peut être représentée par des variables temps dépendantes (même le sexe), volontiers binaires. Il s'agit d'événements ponctuel (notes "staccato") ou d'états prolongées (notes tenues). Ce modèle de données est compatible avec les données usuelles de santé : - les mouvements, événements (admission, mutation) ou états (séjour, passage en soins intensifs) - les données démographiques (âge en classes, sexe) - les mesures de biologie médicale, événements (mesure) ou états (hypo/hyper/normo-kaliémie, période sans mesure) - les médicaments, avec ou sans dose (kayexalate, kayexalate \textgreater 15) - les codes PMSI, événements (actes CCAM) ou états (diagnostics CIM10). Cette représentation intermédiaire de données serait compatible avec toutes les caractéristiques du modèle de Cox à covariables temps dépendantes, des arbres de survie, et des règles d'association temporelles, hormis l'utilisation directe de variables quantitatives. Discussion/Conclusion L'extraction de caractéristiques serait ainsi séparée en : 1 - génération d'une partition d'orgue de barbarie (simplifie la structure des données, abolit l'hétérogénéité, préserve le temps) ; 2 - constitution de données de type questionnaire (simplifie le temps ou le décrit comme une variable). La forme des données étant standardisée par cette approche, la deuxième étape s'appuiera sur des fonctions standardisées (ex : état à un instant, pire état durant une période, temps passé dans un état, délai jusqu'à un événement).
@article{chazard_orgue_2022,
	series = {{VIIIe} {Colloque} national {Adelf}-{Emois}},
	title = {L'orgue de barbarie : proposition d'une représentation des données de santé temps-dépendantes, visant à faciliter leur réutilisation},
	volume = {70},
	issn = {0398-7620},
	shorttitle = {L'orgue de barbarie},
	url = {https://www.sciencedirect.com/science/article/pii/S0398762022000694},
	doi = {10.1016/j.respe.2022.01.068},
	abstract = {Introduction
Les données structurées d'entrepôts de santé sont complexes (centaines de tables, variables qualitatives multivaluées, déséquilibrées, manquantes). L'extraction de caractéristique génère des données ressemblant aux données de questionnaires, aisément analysables. Trop souvent, elle écrase la temporalité des données.
Objectif
Proposer une méthodologie d'extraction de caractéristiques sécurisant la gestion du temps.
Méthodes
Analogie entre les partitions d'orgue de barbarie et les données de santé temps-dépendantes. Etude de compatibilité avec les données structurées fréquemment rencontrées (PMSI, médicaments, biologie médicale). Etude de compatibilité avec les méthodes statistiques d'analyse de données temps-dépendantes.
Résultats
Les partitions d'orgue de barbarie sont constituées de pistes représentant des notes, qui peuvent être actives (perforées) ou non. Ces pistes synchronisées défilent et jouent une musique. Pareillement, un patient peut être représentée par des variables temps dépendantes (même le sexe), volontiers binaires. Il s'agit d'événements ponctuel (notes "staccato") ou d'états prolongées (notes tenues). Ce modèle de données est compatible avec les données usuelles de santé : - les mouvements, événements (admission, mutation) ou états (séjour, passage en soins intensifs) - les données démographiques (âge en classes, sexe) - les mesures de biologie médicale, événements (mesure) ou états (hypo/hyper/normo-kaliémie, période sans mesure) - les médicaments, avec ou sans dose (kayexalate, kayexalate {\textgreater} 15) - les codes PMSI, événements (actes CCAM) ou états (diagnostics CIM10). Cette représentation intermédiaire de données serait compatible avec toutes les caractéristiques du modèle de Cox à covariables temps dépendantes, des arbres de survie, et des règles d'association temporelles, hormis l'utilisation directe de variables quantitatives.
Discussion/Conclusion
L'extraction de caractéristiques serait ainsi séparée en : 1 - génération d'une partition d'orgue de barbarie (simplifie la structure des données, abolit l'hétérogénéité, préserve le temps) ; 2 - constitution de données de type questionnaire (simplifie le temps ou le décrit comme une variable). La forme des données étant standardisée par cette approche, la deuxième étape s'appuiera sur des fonctions standardisées (ex : état à un instant, pire état durant une période, temps passé dans un état, délai jusqu'à un événement).},
	language = {fr},
	urldate = {2022-05-02},
	journal = {Revue d'Épidémiologie et de Santé Publique},
	author = {Chazard, E. and Balaye, P. and Balcaen, T. and Genin, M. and Cuggia, M. and Bouzille, G. and Lamer, A.},
	month = mar,
	year = {2022},
	keywords = {Analyses de survie, Extraction de caractéristiques, Réutilisation de données},
	pages = {S8},
}

Downloads: 0