Construction et évaluation de règles de prédiction de diagnostics à partir des bases de données hospitalières : application au contrôle qualité des données médico-administratives. Djennaoui, M., Ficheur, G., Aernout, E., Beuscart, R., & Chazard, E. Revue d'Épidémiologie et de Santé Publique, 63, Supplement 1:S11, March, 2015.
Construction et évaluation de règles de prédiction de diagnostics à partir des bases de données hospitalières : application au contrôle qualité des données médico-administratives [link]Paper  doi  abstract   bibtex   
Introduction Dans le cadre du « Programme de médicalisation du système d’information » (PMSI), l’instauration de la tarification à l’activité (T2A) a incité les établissements de santé à établir des procédures de contrôle optimisant la rémunération des séjours, le recodage de complications et morbidités associées (CMA) constituant une de ces procédures. Les méthodes de data mining suscitent beaucoup d’intérêt dans l’analyse des bases de données et produisent des règles prédictives simples d’application. Notre objectif était de produire par data mining à partir des données de la base nationale PMSI des règles de prédiction de CMA applicables au contrôle qualité des séjours. Méthodes Notre échantillon provenait de la base nationale PMSI pour les années 2007 à 2010. Les CMA prédites devaient être fréquentes et caractériser une pathologie chronique, la prédiction se basant sur les codes diagnostiques et d’actes. Les règles construites étaient de type séquentiel, avec pour seuils de support et de confiance 0,00075 et 0,5 respectivement. Les règles produites étaient sélectionnées selon leur confiance et leur support puis évaluées par une revue de cas réels à partir des courriers de sortie ; le pouvoir prédictif des règles était confronté au pouvoir prédictif des CMA seules et évalué par le calcul du lift (rapport de la valeur prédictive positive de la règle sur la valeur prédictive positive de la CMA seule). Résultats Notre échantillon comportait 59 170 séjours. Les CMA ciblées étaient les codes E11 « diabète sucré type 2 », I48 « fibrillation atriale » et I50 « insuffisance cardiaque ». Nous avons extrait six règles séquentielles et validé à l’issue de la procédure de contrôle (432 cas revus) trois règles prédictives ayant toutes un lift supérieur ou égal à 1,30 : – \E11,I10,DZQM006\ => \E11\ ; – \E11,I10,I48\ => \E11\ ; – \I48,I69\ => \I48\. Discussion/conclusion Notre étude a permis d’extraire à partir de la base nationale PMSI, par data mining, des règles de prédiction de CMA valides, fiables et simples d’application dans le cadre du contrôle qualité des séjours.
@article{djennaoui_construction_2015,
	series = {{XXVIIIe} {Congrès} national Émois, {Nancy}, 26 et 27 mars 2015},
	title = {Construction et évaluation de règles de prédiction de diagnostics à partir des bases de données hospitalières : application au contrôle qualité des données médico-administratives},
	volume = {63, Supplement 1},
	issn = {0398-7620},
	shorttitle = {Construction et évaluation de règles de prédiction de diagnostics à partir des bases de données hospitalières},
	url = {http://www.sciencedirect.com/science/article/pii/S0398762015000218},
	doi = {10.1016/j.respe.2015.01.020},
	abstract = {Introduction
Dans le cadre du « Programme de médicalisation du système d’information » (PMSI), l’instauration de la tarification à l’activité (T2A) a incité les établissements de santé à établir des procédures de contrôle optimisant la rémunération des séjours, le recodage de complications et morbidités associées (CMA) constituant une de ces procédures. Les méthodes de data mining suscitent beaucoup d’intérêt dans l’analyse des bases de données et produisent des règles prédictives simples d’application. Notre objectif était de produire par data mining à partir des données de la base nationale PMSI des règles de prédiction de CMA applicables au contrôle qualité des séjours.
Méthodes
Notre échantillon provenait de la base nationale PMSI pour les années 2007 à 2010. Les CMA prédites devaient être fréquentes et caractériser une pathologie chronique, la prédiction se basant sur les codes diagnostiques et d’actes. Les règles construites étaient de type séquentiel, avec pour seuils de support et de confiance 0,00075 et 0,5 respectivement. Les règles produites étaient sélectionnées selon leur confiance et leur support puis évaluées par une revue de cas réels à partir des courriers de sortie ; le pouvoir prédictif des règles était confronté au pouvoir prédictif des CMA seules et évalué par le calcul du lift (rapport de la valeur prédictive positive de la règle sur la valeur prédictive positive de la CMA seule).
Résultats
Notre échantillon comportait 59 170 séjours. Les CMA ciblées étaient les codes E11 « diabète sucré type 2 », I48 « fibrillation atriale » et I50 « insuffisance cardiaque ». Nous avons extrait six règles séquentielles et validé à l’issue de la procédure de contrôle (432 cas revus) trois règles prédictives ayant toutes un lift supérieur ou égal à 1,30 :

– \{E11,I10,DZQM006\} =\> \{E11\} ;

– \{E11,I10,I48\} =\> \{E11\} ;

– \{I48,I69\} =\> \{I48\}.
Discussion/conclusion
Notre étude a permis d’extraire à partir de la base nationale PMSI, par data mining, des règles de prédiction de CMA valides, fiables et simples d’application dans le cadre du contrôle qualité des séjours.},
	urldate = {2015-04-04},
	journal = {Revue d'Épidémiologie et de Santé Publique},
	author = {Djennaoui, M. and Ficheur, G. and Aernout, E. and Beuscart, R. and Chazard, E.},
	month = mar,
	year = {2015},
	keywords = {Base nationale PMSI, Contrôle qualité T2A, Règles séquentielles},
	pages = {S11},
}

Downloads: 0