Applicability and robustness of an artificial intelligence-based assessment for Greulich and Pyle bone age in a German cohort

Rofo. 2024 Jun;196(6):600-606. doi: 10.1055/a-2203-2997. Epub 2023 Dec 8.

Abstract

Purpose: The determination of bone age (BA) based on the hand and wrist, using the 70-year-old Greulich and Pyle (G&P) atlas, remains a widely employed practice in various institutions today. However, a more recent approach utilizing artificial intelligence (AI) enables automated BA estimation based on the G&P atlas. Nevertheless, AI-based methods encounter limitations when dealing with images that deviate from the standard hand and wrist projections. Generally, the extent to which BA, as determined by the G&P atlas, corresponds to the chronological age (CA) of a contemporary German population remains a subject of continued discourse. This study aims to address two main objectives. Firstly, it seeks to investigate whether the G&P atlas, as applied by the AI software, is still relevant for healthy children in Germany today. Secondly, the study aims to assess the performance of the AI software in handling non-strict posterior-anterior (p. a.) projections of the hand and wrist.

Materials and methods: The AI software retrospectively estimated the BA in children who had undergone radiographs of a single hand using posterior-anterior and oblique planes. The primary purpose was to rule out any osseous injuries. The prediction error of BA in relation to CA was calculated for each plane and between the two planes.

Results: A total of 1253 patients (aged 3 to 16 years, median age 10.8 years, 55.7 % male) were included in the study. The average error of BA in posterior-anterior projections compared to CA was 3.0 (± 13.7) months for boys and 1.7 (± 13.7) months for girls. Interestingly, the deviation from CA tended to be even slightly lower in oblique projections than in posterior-anterior projections. The mean error in the posterior-anterior projection plane was 2.5 (± 13.7) months, while in the oblique plane it was 1.8 (± 13.9) months (p = 0.01).

Conclusion: The AI software for BA generally corresponds to the age of the contemporary German population under study, although there is a noticeable prediction error, particularly in younger children. Notably, the software demonstrates robust performance in oblique projections.

Key points: · Bone age, as determined by artificial intelligence, aligns with the chronological age of the contemporary German cohort under study.. · As determined by artificial intelligence, bone age is remarkably robust, even when utilizing oblique X-ray projections..

Citation format: · Pape J, Hirsch F, Deffaa O et al. Applicability and robustness of an artificial intelligence-based assessment for Greulich and Pyle bone age in a German cohort. Fortschr Röntgenstr 2024; 196: 600 - 606.

ZIEL: Die Bestimmung des Knochenalters (BA) anhand der Hand und des Handgelenks unter Verwendung des 70 Jahre alten Atlas von Greulich und Pyle (G&P) ist auch heute noch eine weit verbreitete Praxis in verschiedenen Einrichtungen. Ein neuerer Ansatz, basierend auf dem Einsatz künstlicher Intelligenz (KI), ermöglicht eine automatische BA-Schätzung auf der Grundlage des G&P-Atlas. Allerdings stoßen KI-basierte Methoden an ihre Grenzen, wenn es um Bilder geht, die von den Standardprojektionen der Hand und des Handgelenks abweichen. Nach wie vor ist umstritten, inwieweit das mit dem G&P-Atlas ermittelte BA dem chronologischen Alter (CA) der heutigen deutschen Bevölkerung entspricht. Mit dieser Studie werden zwei Hauptziele verfolgt. Erstens soll untersucht werden, ob der G&P-Atlas, wie er von der KI-Software angewendet wird, für gesunde Kinder in Deutschland heute noch relevant ist. Zweitens zielt die Studie darauf ab, die Leistung der KI-Software bei der Handhabung nicht-strikter posterior-anteriorer (p. a.) Projektionen der Hand und des Handgelenks zu bewerten.

Materialien und methoden: Die AI-Software schätzte retrospektiv die BA bei Kindern, die sich Röntgenaufnahmen einer einzelnen Hand unter Verwendung von posterior-anterioren und schrägen Ebenen unterzogen hatten. Der Hauptzweck bestand darin, knöcherne Verletzungen auszuschließen. Der Vorhersagefehler des BA im Verhältnis zum CA wurde für jede Ebene und zwischen den beiden Ebenen berechnet.

Ergebnisse: Insgesamt wurden 1253 Patienten (im Alter von 3 bis 16 Jahren, medianes Alter 10,8 Jahre, 55,7 % männlich) in die Studie aufgenommen. Die durchschnittliche Abweichung des BA in posterior-anterioren Projektionen im Vergleich zum CA betrug bei Jungen 3,0 (± 13,7) Monate und 1,7 (± 13,7) Monate bei Mädchen. Interessanterweise war die Abweichung des BA vom CA in den schrägen Projektionen tendenziell etwas geringer als in den posterior-anterioren Projektionen. Der mittlere Fehler in der posterior-anterioren Projektionsebene betrug 2,5 (± 13,7) Monate, während er in der schrägen Ebene bei 1,8 (± 13,9) Monaten lag (p = 0,01).

Schlussfolgerung: Das mittels KI-Software ermittelte BA entspricht im Allgemeinen dem Alter der deutschen Untersuchungspopulation, obwohl es einen merklichen Vorhersagefehler gibt, insbesondere bei jüngeren Kindern. Insbesondere bei schrägen Projektionen zeigt die Software eine robuste Leistung.

Kernaussagen: · Das von der künstlichen Intelligenz ermittelte Knochenalter stimmt mit dem chronologischen Alter der untersuchten deutschen Alterskohorte überein.. · Das durch künstliche Intelligenz ermittelte Knochenalter ist bemerkenswert stabil, auch bei der Verwendung schräger Röntgenprojektionen..

MeSH terms

  • Adolescent
  • Age Determination by Skeleton* / methods
  • Artificial Intelligence*
  • Child
  • Child, Preschool
  • Cohort Studies
  • Female
  • Germany
  • Hand Bones / diagnostic imaging
  • Humans
  • Male
  • Reference Values
  • Retrospective Studies
  • Sensitivity and Specificity
  • Software