Background: The hype around artificial intelligence (AI) in radiology continues and the number of approved AI tools is growing steadily. Despite the great potential, integration into clinical routine in radiology remains limited. In addition, the large number of individual applications poses a challenge for clinical routine, as individual applications have to be selected for different questions and organ systems, which increases the complexity and time required.
Objectives: This review will discuss the current status of validation and implementation of AI tools in clinical routine, and identify possible approaches for an improved assessment of the generalizability of results of AI tools.
Materials and methods: A literature search in various literature and product databases as well as publications, position papers, and reports from various stakeholders was conducted for this review.
Results: Scientific evidence and independent validation studies are available for only a few commercial AI tools and the generalizability of the results often remains questionable.
Conclusions: One challenge is the multitude of offerings for individual, specific application areas by a large number of manufacturers, making integration into the existing site-specific IT infrastructure more difficult. Furthermore, remuneration for the use of AI tools in clinical routine by health insurance companies in Germany is lacking. But in order for reimbursement to be granted, the clinical utility of new applications must first be proven. Such proof, however, is lacking for most applications.
Zusammenfassung: HINTERGRUND: Der Hype um künstliche Intelligenz (KI) in der Radiologie ist ungebrochen, und die Anzahl an zugelassenen KI-Tools wächst stetig. Trotz des großen Potenzials bleibt die Integration in die radiologische Routine aktuell limitiert. Zudem bildet die Vielzahl an Einzelanwendungen eine Herausforderung für die klinische Routine, da für verschiedene Fragestellungen und Organsysteme einzelne Anwendungen angewählt werden müssen, was die Komplexität und den Zeitaufwand erhöht.
Ziel der arbeit: In dieser Übersichtsarbeit soll der aktuelle Stand der Validierung und Implementierung von KI-Tools in die klinische Routine mit den aktuellen Limitationen aufgezeigt werden. Außerdem sollen mögliche Lösungsansätze für eine verbesserte Evaluation der Generalisierbarkeit von Ergebnissen der KI-Tools diskutiert werden.
Material und methoden: Für diese Übersichtsarbeit wurde eine Recherche in verschiedenen Literatur- und Produktdatenbanken sowie in Veröffentlichungen, Positionspapieren und Berichten von verschiedenen Interessensgruppen durchgeführt.
Ergebnisse: Für nur wenige kommerzielle KI-Tools sind wissenschaftliche Evidenz und unabhängige Validierungsstudien vorhanden. Zudem bleibt häufig die Generalisierbarkeit der Ergebnisse fraglich.
Diskussion: Ein Problem besteht in der Vielzahl an Angeboten für einzelne, spezifische Anwendungsgebiete durch eine Vielzahl an Herstellern und die dadurch erschwerte Integration in die bestehende standortindividuelle IT-Infrastruktur. Ein weiteres Problem ist die fehlende wirtschaftliche Vergütung für den Einsatz von KI-Tools in der klinischen Routine durch die Krankenkassen in Deutschland. Für eine Vergütung muss jedoch zunächst der klinische Nutzen neuer Anwendungen nachgewiesen werden. Ein solcher Nachweis wiederum fehlt für die meisten Applikationen.
Keywords: Compensation; Cost-benefit calculation; Digitization; Generalizability; Machine learning.
© 2022. The Author(s), under exclusive licence to Springer Medizin Verlag GmbH, ein Teil von Springer Nature.