[1]

R. Wirawan, “Benchmarking Large Language Models on Diagnostic Inference Tasks in Medical Texts”, ATCAEP, vol. 14, no. 9, pp. 15–31, Sep. 2024, Accessed: Jan. 15, 2026. [Online]. Available: https://heilarchive.com/index.php/ATCAEP/article/view/2024-SEP-07