Background: Inaccurate blood pressure (BP) classification results in inappropriate treatment. We tested whether machine learning (ML), using routine clinical data, can serve as a reliable alternative to ambulatory BP monitoring (ABPM) in classifying BP status.
Methods: This study employed a multicentre approach involving 3 derivation cohorts from Glasgow, Gdańsk, and Birmingham, and a fourth independent evaluation cohort. ML models were trained using office BP, ABPM, and clinical, laboratory, and demographic data, collected from patients referred for hypertension assessment. Seven ML algorithms were trained to classify patients into 5 groups, named as follows: Normal/Target; Hypertension-Masked; Normal/Target-White-Coat (WC); Hypertension-WC; and Hypertension. The 10-year cardiovascular outcomes and 27-year all-cause mortality risks were calculated for the ML-derived groups using the Cox proportional hazards model.
Results: Overall, extreme gradient boosting (using XGBoost open source software) showed the highest area under the receiver operating characteristic curve of 0.85-0.88 across derivation cohorts, Glasgow (n = 923; 43% female; age 50.7 ± 16.3 years), Gdańsk (n = 709; 46% female; age 54.4 ± 13 years), and Birmingham (n = 1222; 56% female; age 55.7 ± 14 years). But accuracy (0.57-0.72) and F1 (harmonic mean of precision and recall) scores (0.57-0.69) were low across the 3 patient cohorts. The evaluation cohort (n = 6213; 51% female; age 51.2 ± 10.8 years) indicated elevated 10-year risks of composite cardiovascular events in the Normal/Target-WC and the Hypertension-WC groups, with heightened 27-year all-cause mortality observed in all groups, except the Hypertension-Masked group, compared to the Normal/Target group.
Conclusions: ML has limited potential in accurate BP classification when ABPM is unavailable. Larger studies including diverse patient groups and different resource settings are warranted.
Contexte: Les erreurs dans la classification des valeurs de la pression artérielle (PA) entraînent une inadéquation du traitement. Nous avons tâché de déterminer si l’apprentissage machine, à l’aide de données cliniques routinières, constituait une solution de rechange fiable à la surveillance ambulatoire de la PA pour définir le statut de la PA.
Méthodologie: Cette étude a utilisé une approche multicentrique incluant trois cohortes de dérivation de Glasgow, Gdańsk et Birmingham, et une quatrième cohorte d’évaluation indépendante. Les modèles d’apprentissage machine ont été développés en analysant les données démographiques, les valeurs de la PA mesurée au cabinet, les données relatives à la surveillance ambulatoire de la PA et aux épreuves de laboratoire recueillies auprès de patients adressés pour une évaluation de l’hypertension. Sept algorithmes d’apprentissage machine ont été appliqués pour classer les patients en cinq groupes : Normale/Cible; Hypertension-Masquée; Normal/Cible-Blouse blanche; Hypertension-Blouse blanche; Hypertension. Les événements cardiovasculaires sur 10 ans et le risque de mortalité toutes causes confondues sur 27 ans ont été calculés dans les groupes dérivés de l’apprentissage machine à l’aide d’un modèle de risques proportionnels de Cox.
Résultats: D’une manière générale, l’amplification de gradient extrême (à l’aide du logiciel ouvert XGBoost) a mis en évidence l’aire sous la courbe de la fonction d’efficacité du récepteur (courbe ROC pour Receiver Operating Characteristic) la plus haute, soit 0,85 à 0,88, pour toutes les cohortes de dérivation : Glasgow (n = 923; 43 % de femmes; âge : 50,7 ± 16,3 ans); Gdańsk (n = 709; 46 % de femmes; âge : 54,4 ± 13 ans); Birmingham (n = 1 222; 56 % de femmes; âge : 55,7 ± 14 ans). La précision (0,57 – 0,72) et le score F1 (moyenne harmonique de la précision et du rappel) (0,57 – 0,69) ont été faibles dans les trois cohortes de patients. La cohorte d’évaluation (n = 6 213; 51 % de femmes; âge : 51,2 ± 10,8 ans) a indiqué un risque d’événements cardiovasculaires composites sur 10 ans élevé dans les groupes Normale/Cible-Blouse blanche et Hypertension-Blouse blanche, tandis qu’une hausse de la mortalité toutes causes confondues sur 27 ans a été observée dans tous les groupes, sauf dans le groupe Hypertension-Masquée, comparativement au groupe Normale/Cible.
Conclusions: Le potentiel d’exactitude de la classification de la PA à l’aide de l’apprentissage machine lorsque la surveillance ambulatoire de la PA n’est pas possible est limité. Des études de plus grande envergure portant sur des groupes de patients et des niveaux de ressources diversifiés s’imposent.
© 2024 The Authors.