The IMPACT framework for evaluating generative AI in critical care: development and multinational consensus validation

Yeh Y.C.; Shih M.C.; De Backer D.; Celi L.A.; See K.C.; Fujii T.; Ling L.; Mongkolpun W.; Hu H.W.; Chen H.Y.; Chen W.C.; Cholley B.; Fong K.K.; Ryu H.G.; Na S.; Egi M.; Chan W.S.; Chen K.F.; Kamaleswaran R.; Chuang Y.C.; Yang C.J.; Hsiao W.L.; Lai S.R.; Ku D.; Jahan A.; Martin G.S.

The IMPACT framework for evaluating generative AI in critical care: development and multinational consensus validation

dc.contributor.author	Yeh Y.C.
dc.contributor.author	Shih M.C.
dc.contributor.author	De Backer D.
dc.contributor.author	Celi L.A.
dc.contributor.author	See K.C.
dc.contributor.author	Fujii T.
dc.contributor.author	Ling L.
dc.contributor.author	Mongkolpun W.
dc.contributor.author	Hu H.W.
dc.contributor.author	Chen H.Y.
dc.contributor.author	Chen W.C.
dc.contributor.author	Cholley B.
dc.contributor.author	Fong K.K.
dc.contributor.author	Ryu H.G.
dc.contributor.author	Na S.
dc.contributor.author	Egi M.
dc.contributor.author	Chan W.S.
dc.contributor.author	Chen K.F.
dc.contributor.author	Kamaleswaran R.
dc.contributor.author	Chuang Y.C.
dc.contributor.author	Yang C.J.
dc.contributor.author	Hsiao W.L.
dc.contributor.author	Lai S.R.
dc.contributor.author	Ku D.
dc.contributor.author	Jahan A.
dc.contributor.author	Martin G.S.
dc.contributor.correspondence	Yeh Y.C.
dc.contributor.other	Mahidol University
dc.date.accessioned	2026-06-08T18:15:28Z
dc.date.available	2026-06-08T18:15:28Z
dc.date.issued	2026-01-01
dc.description.abstract	Background Generative artificial intelligence (GenAI) is increasingly used for clinical decision support in critical care, yet standardized methods for evaluating GenAI content in intensive care settings are lacking. Existing metrics assess textual similarity but fail to capture clinical accuracy, reasoning quality, or urgency. Methods We developed and validated the IMPACT framework through a five-phase multinational panel consensus process. Reporting adhered to the ACCORD guideline. A steering committee of eight persons provided clinical and methodological oversight. Panelists were recruited through purposive sampling to ensure geographic and multidisciplinary representation. Content validity was assessed using the Content Validity Ratio (CVR) and Item-level Content Validity Index (I-CVI), with retention thresholds set at 70% agreement and I-CVI ≥0.80. Results A total of 58 panelists from 12 countries and regions participated, with 42 completing formal consensus voting. Participants included intensivists, physicians with AI research expertise, information technology specialists, and other critical care professionals. All six IMPACT domains exceeded validity thresholds (mean agreement 89.3%, CVR = 0.79, I-CVI = 0.92). Of 24 candidate subitems, 21 met retention criteria (mean agreement 85.7%, CVR = 0.71, I-CVI = 0.90). Three subitems were removed due to insufficient consensus and conceptual overlap. The validated framework comprises six domains with 21 subitems. Conclusions The IMPACT framework provides a consensus-validated approach for evaluating GenAI clinical decision support in intensive care, addressing gaps in current evaluation methods.
dc.identifier.citation	Annals of Intensive Care Vol.16 (2026)
dc.identifier.doi	10.1016/j.aicoj.2026.100078
dc.identifier.eissn	21105820
dc.identifier.scopus	2-s2.0-105040547932
dc.identifier.uri	https://repository.li.mahidol.ac.th/handle/123456789/117141
dc.rights.holder	SCOPUS
dc.subject	Medicine
dc.title	The IMPACT framework for evaluating generative AI in critical care: development and multinational consensus validation
dc.type	Article
mu.datasource.scopus	https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=105040547932&origin=inward
oaire.citation.title	Annals of Intensive Care
oaire.citation.volume	16
oairecerif.author.affiliation	Massachusetts Institute of Technology
oairecerif.author.affiliation	Chinese University of Hong Kong
oairecerif.author.affiliation	Emory University School of Medicine
oairecerif.author.affiliation	Université Libre de Bruxelles
oairecerif.author.affiliation	National Tsing Hua University
oairecerif.author.affiliation	Duke University School of Medicine
oairecerif.author.affiliation	National Taiwan University Hospital
oairecerif.author.affiliation	Chang Gung University
oairecerif.author.affiliation	Seoul National University Hospital
oairecerif.author.affiliation	China Medical University Hospital
oairecerif.author.affiliation	Hôpital Européen Georges-Pompidou
oairecerif.author.affiliation	Siriraj Hospital
oairecerif.author.affiliation	National University Hospital
oairecerif.author.affiliation	Severance Hospital
oairecerif.author.affiliation	Monash Health
oairecerif.author.affiliation	Kyoto University Hospital
oairecerif.author.affiliation	Far Eastern Memorial Hospital
oairecerif.author.affiliation	Jikei University Hospital
oairecerif.author.affiliation	Queen Elizabeth Hospital
oairecerif.author.affiliation	Brahmanbaria Medical College
oairecerif.author.affiliation	Taiwan Artificial Intelligence Foundation

Collections

Scopus 2026

	Office Hour: Monday-Friday 08.30-12.00 and 13.00-16.30 hrs.
	Phutthamonthon Sai 4 Rd. Salaya, Nakhon Pathom 73170, Thailand
	The office: +66 (2) 800 2680 ext.4306
	thipsuda.van@mahidol.ac.th
	https://repository.li.mahidol.ac.th

The IMPACT framework for evaluating generative AI in critical care: development and multinational consensus validation

Files

Collections