Validating viral hepatitis B and C diagnosis codes: a retrospective analysis using Ontario's health administrative data

Can J Public Health. 2021 Jun;112(3):502-512. doi: 10.17269/s41997-020-00435-x. Epub 2021 Jan 8.

Abstract

Objective: We aimed to determine the criterion validity of using diagnosis codes for hepatitis B virus (HBV) and hepatitis C virus (HCV) to identify infections.

Methods: Using linked laboratory and administrative data in Ontario, Canada, from January 2004 to December 2014, we validated HBV/HCV diagnosis codes against laboratory-confirmed infections. Performance measures (sensitivity, specificity, and positive predictive value) were estimated via cross-validated logistic regression and we explored variations by varying time windows from 1 to 5 years before (i.e., prognostic prediction) and after (i.e., diagnostic prediction) the date of laboratory confirmation. Subgroup analyses were performed among immigrants, males, baby boomers, and females to examine the robustness of these measures.

Results: A total of 1,599,023 individuals were tested for HBV and 840,924 for HCV, with a resulting 41,714 (2.7%) and 58,563 (7.0%) infections identified, respectively. HBV/HCV diagnosis codes ± 3 years of laboratory confirmation showed high specificity (99.9% HBV; 99.8% HCV), moderate positive predictive value (70.3% HBV; 85.8% HCV), and low sensitivity (12.8% HBV; 30.8% HCV). Varying the time window resulted in limited changes to performance measures. Diagnostic models consistently outperformed prognostic models. No major differences were observed among subgroups.

Conclusion: HBV/HCV codes should not be the only source used for monitoring the population burden of these infections, due to low sensitivity and moderate positive predictive values. These results underscore the importance of ongoing laboratory and reportable disease surveillance systems for monitoring viral hepatitis in Ontario.

RéSUMé: OBJECTIF: Nous avons cherché à déterminer le critère de validité de l’utilisation des codes de diagnostic du virus de l’hépatite B (VHB) et du virus de l’hépatite C (VHC) pour identifier les infections. MéTHODES: En utilisant des données de laboratoire et administratives couplées en Ontario, au Canada, de janvier 2004 à décembre 2014, nous avons validé les codes de diagnostic du VHB/VHC contre les infections confirmées en laboratoire. Les mesures du rendement (sensibilité, spécificité et valeur prédictive positive) ont été estimées par régression logistique croisée et nous avons exploré les variations en variant les fenêtres temporelles de 1 à 5 ans avant (c.-à-d. prédiction pronostique) et après (c.-à-d. prédiction diagnostique) la date de confirmation en laboratoire. Des analyses de sous-groupes ont été effectuées auprès d’immigrants, d’hommes, de baby-boomers et de femmes pour examiner la robustesse de ces mesures. RéSULTATS: 1 599 023 individus ont été testés pour le VHB et 840 924 pour le VHC, dont 41 714 (2,7 %) et 58 563 (7,0 %) infections ont été identifiées, respectivement. Les codes de diagnostic VHB/VHC ± 3 ans de confirmation en laboratoire ont montré une spécificité élevée (99,9 % VHB; 99,8 % VHC), une valeur prédictive positive modérée (70,3 % VHB; 85,8 % VHC) et une faible sensibilité (12,8 % VHB; 30,8 % VHC). La variation de la fenêtre temporelle a entraîné des changements limités aux mesures du rendement. Les modèles diagnostiques ont constamment surpassé les modèles pronostiques. Aucune différence majeure n’a été observée entre les sous-groupes. CONCLUSION: Les codes VHB/VHC ne devraient pas être la seule source utilisée pour surveiller la charge de population de ces infections, en raison de la faible sensibilité et des valeurs prédictives positives modérées. Ces résultats soulignent l’importance des systèmes continus de surveillance des maladies à déclaration obligatoire en laboratoire pour surveiller l’hépatite virale en Ontario.

Keywords: Health administrative data; Immigrants; Validation study; Viral hepatitis.

Publication types

  • Research Support, Non-U.S. Gov't

MeSH terms

  • Clinical Coding*
  • Clinical Laboratory Techniques / statistics & numerical data
  • Female
  • Hepatitis B* / diagnosis
  • Hepatitis B* / epidemiology
  • Hepatitis C* / diagnosis
  • Hepatitis C* / epidemiology
  • Humans
  • Logistic Models
  • Male
  • Ontario / epidemiology
  • Reproducibility of Results
  • Retrospective Studies

Grants and funding