Validation of coding algorithms for the identification of patients with primary biliary cirrhosis using administrative data

Can J Gastroenterol. 2010 Mar;24(3):175-82. doi: 10.1155/2010/237860.

Abstract

Background: Large-scale epidemiological studies of primary biliary cirrhosis (PBC) have been hindered by difficulties in case ascertainment.

Objective: To develop coding algorithms for identifying PBC patients using administrative data--a widely available data source.

Methods: Population-based administrative databases were used to identify patients with a diagnosis code for PBC from 1994 to 2002. Coding algorithms for confirmed PBC (two or more of antimitochondrial antibody positivity, cholestatic liver biochemistry and/or compatible liver histology) were derived using chart abstraction data as the reference. Patients with a recorded PBC diagnosis but insufficient confirmatory data were classified as 'suspected PBC'.

Results: Of 189 potential PBC cases, 119 (60%) had confirmed PBC and 28 (14%) had suspected PBC. The optimal algorithm including two or more uses of a PBC code had a sensitivity of 94% (95% CI 71% to 100%) and positive predictive values of 73% (95% CI 61% to 75%) for confirmed PBC, and 89% (95% CI 82% to 94%) for confirmed or suspected PBC. Sensitivity analyses revealed greater accuracy among women, and with the use of multiple data sources and one or more years of data. Inclusion of diagnosis codes for conditions frequently misclassified as PBC did not improve algorithm performance.

Conclusions: Administrative databases can reliably identify patients with PBC and may facilitate epidemiological investigations of this condition.

HISTORIQUE :: Les études épidémiologiques à grande échelle de la cirrhose biliaire primitive (CBP) sont entravées par des problèmes de détermination des cas.

OBJECTIF :: Élaborer des algorithmes de codage pour repérer les patients atteints de CBP au moyen de données administratives, une source de données largement disponible.

MÉTHODOLOGIE :: Les auteurs ont utilisé des bases de données administratives en population pour dépister des patients ayant obtenu un code diagnostique de CBP entre 1994 et 2002. Ils ont dérivé les algorithmes de codage de CBP confirmée (au moins deux des éléments suivants : positivité aux anticorps antimitochondries, biochimie du foie cholostatique et histologie hépatique compatible) au moyen de données d’abstraction des dossiers en guise de référence. Les patients ayant un diagnostic de CBP établi mais des données de confirmation insuffisantes étaient classés comme « CBP présumée ».

RÉSULTATS :: Sur 189 cas de CBP potentiels, 119 (60 %) avaient une CBP confirmée et 28 (14 %), une CBP présumée. L’algorithme optimal incluant au moins deux usages du code de CBP avait une sensibilité de 94 % (95 % IC 71 % à 100 %) et des valeurs prédictives positives de 73 % (95 % IC 61 % à 75 %) en cas de CBP confirmée, et de 89 % (95 % IC 82 % à 94 %) en cas de CBP confirmée ou présumée. Les analyses de sensibilité ont révélé une plus grande précision chez les femmes et à l’aide de multiples sources de données et d’au moins une année de données. L’inclusion des codes diagnostiques de troubles souvent mal classés comme une CBP n’améliorait pas le rendement de l’algorithme.

CONCLUSIONS :: Les bases de données administratives peuvent permettre de repérer avec fiabilité les patients atteints d’une CBP et faciliter les explorations épidémiologiques de cette maladie.

Publication types

  • Research Support, Non-U.S. Gov't
  • Validation Study

MeSH terms

  • Adult
  • Aged
  • Aged, 80 and over
  • Algorithms*
  • Databases, Factual
  • Epidemiologic Methods
  • Epidemiologic Research Design*
  • Female
  • Forms and Records Control / methods
  • Humans
  • Liver Cirrhosis, Biliary / diagnosis*
  • Liver Cirrhosis, Biliary / epidemiology
  • Male
  • Middle Aged
  • Predictive Value of Tests
  • Sensitivity and Specificity
  • Young Adult