Performance of ChatGPT-4o on the Japanese Medical Licensing Examination: Evalution of Accuracy in Text-Only and Image-Based Questions

Yuki Miyazaki; Masahiro Hata; Hisaki Omori; Atsuya Hirashima; Yuta Nakagawa; Mitsuhiro Eto; Shun Takahashi; Manabu Ikeda

doi:10.2196/63129

Performance of ChatGPT-4o on the Japanese Medical Licensing Examination: Evalution of Accuracy in Text-Only and Image-Based Questions

JMIR Med Educ. 2024 Dec 24:10:e63129. doi: 10.2196/63129.

Authors

Yuki Miyazaki¹, Masahiro Hata¹, Hisaki Omori^{1

2}, Atsuya Hirashima^{1

3}, Yuta Nakagawa^{1

4}, Mitsuhiro Eto^{1

4}, Shun Takahashi^{1

5

6

7}, Manabu Ikeda¹

Affiliations

¹ Department of Psychiatry, Osaka University Graduate School of Medicine, Suita, Japan.
² Department of Psychiatry, Shichiyama Hospital, Sennan District, Japan.
³ Department of Psychiatry, Osaka Psychiatric Medical Center, Hirakata, Japan.
⁴ Department of Psychiatry, Asakayama General Hospital, Sakai, Japan.
⁵ Clinical Research and Education Center, Asakayama General Hospital, Sakai, Japan.
⁶ Graduate School of Rehabilitation Science, Osaka Metropolitan University, Habikino, Japan.
⁷ Department of Neuropsychiatry, Wakayama Medical University, Wakayama, Japan.

PMID: 39718557
DOI: 10.2196/63129

Abstract

This study evaluated the performance of ChatGPT with GPT-4 Omni (GPT-4o) on the 118th Japanese Medical Licensing Examination. The study focused on both text-only and image-based questions. The model demonstrated a high level of accuracy overall, with no significant difference in performance between text-only and image-based questions. Common errors included clinical judgment mistakes and prioritization issues, underscoring the need for further improvement in the integration of artificial intelligence into medical education and practice.

Keywords: AI technology; ChatGPT; GPT-4o; Japan; accuracy; application; artificial intelligence; clinical decision-making; decision-making; image-based; images; medical education; medical licensing examination; reliability.

MeSH terms

Artificial Intelligence
East Asian People
Educational Measurement* / methods
Humans
Japan
Licensure, Medical*