محققان گزارش میدهند که چت جیپیتی (ChatGPT) در موارد شبیه سازی شده بیماران مبتلا به درد قفسه سینه نتایج متناقضی ارائه میدهد. هوش مصنوعی سطوح مختلف ارزیابی خطر قلبی را برای همان دادههای بیمار برگرداند - نه چیزی که پزشکان میخواهند هنگام پاسخ به یک اورژانس پزشکی ببینند.
به گزارش ایتنا، بر اساس یافتههایی که اخیراً در مجله PLOS One منتشر شد، هوش مصنوعی نتوانست به خوبی روشهای سنتی را که پزشکان برای خطر قلبی بیمار استفاده میکنند، انجام دهد.
برای این مطالعه، محققان چت جیپیتی را با هزاران مورد شبیه سازی شده از بیماران مبتلا به بیماری قلبی آموزش دادند. تحقیقات قبلی نشان میداد که هوش مصنوعی میتواند امتحانات پزشکی را پشت سر بگذارد، بنابراین انتظار میرود که در پاسخ به فوریتهای پزشکی مفید باشد.
درد قفسه سینه یک شکایت رایج در اورژانس است و پزشکان باید به سرعت و فوریت وضعیت بیمار را ارزیابی کنند. به گفته پزشکان، موارد بسیار جدی را میتوان به راحتی از روی علائم شناسایی کرد، اما موارد کم خطر میتواند پیچیدهتر باشد. تصمیم گیری در مورد اینکه آیا فرد بیمار باید برای ارزیابی در بیمارستان نگهداری شود یا به خانه فرستاده شود، میتواند دشوار باشد.
هستون، پزشک محقق، توضیح داد که امروزه پزشکان اغلب از دو معیار برای ارزیابی خطر قلبی استفاده میکنند که TIMI و HEART نامیده میشوند. این چک لیستها به عنوان ماشینحسابی عمل میکنند که از علائم، سابقه پزشکی و سن برای تعیین ریسک یک بیمار قلبی استفاده میکنند. در مقابل، هوش مصنوعی مانند چت جیپیتی میتواند هزاران متغیر را به سرعت ارزیابی کند، ظاهراً به این معنی است که ممکن است بتواند یک وضعیت پیچیده پزشکی را سریعتر و دقیقتر تجزیه و تحلیل کند.
محققان سه مجموعه از 10000 مورد شبیه سازی شده تصادفی ایجاد کردند. مجموعه اول شامل هفت متغیر مورد استفاده برای مقیاس TIMI، دومی پنج متغیر مورد استفاده در HEART، و مجموعه سوم دارای مجموعه پیچیدهتری از 44 قرائت تصادفی سلامت بود.
هنگامی که دو مجموعه داده اول تغذیه شد، چت جیپیتی با امتیازهای ثابت TIMI و HEART، به ترتیب 45 و 48 درصد موافقت کرد. در آخرین مجموعه داده، محققان همان موارد را چهار بار انجام دادند و دریافتند که چت جیپیتی اغلب حتی نمیتواند با خودش موافق باشد. هوش مصنوعی در 44 درصد مواقع ارزیابیهای متفاوتی را برای موارد مشابه ارائه داد.
این مشکل احتمالاً به دلیل تصادفی بودن نسخه فعلی نرم افزار چت جیپیتی است که به آن کمک میکند تا پاسخهای خود را برای شبیه سازی زبان طبیعی تغییر دهد.
چنین تصادفی در مراقبتهای بهداشتی مفید نیست، جایی که تصمیمات درمانی نیاز به یک پاسخ واحد و ثابت دارد.
هستون گفت: « ما متوجه شدیم که تنوع زیادی وجود دارد و این تغییر در رویکرد میتواند خطرناک باشد. این فناوری میتواند ابزار مفیدی باشد، اما فکر میکنم که این فناوری بسیار سریعتر از درک ما از آن پیش میرود، بنابراین مهم است که تحقیقات زیادی انجام دهیم، بهویژه در این موقعیتهای بالینی پر خطر.»
علیرغم این مطالعه، هستون خاطرنشان کرد که هوش مصنوعی این پتانسیل را دارد که واقعاً در اورژانس مفید باشد. هستون گفت:« برای مثال، کل پرونده پزشکی یک فرد میتواند وارد برنامه شده و مرتبطترین حقایق را در مورد یک بیمار به سرعت در شرایط اضطراری ارائه کند. پزشکان همچنین میتوانند از برنامه بخواهند تا چندین تشخیص احتمالی را در موارد دشوار و پیچیده ارائه دهد.»
هستون گفت:« چتجیپیتی میتواند در ایجاد تشخیص افتراقی عالی باشد و این احتمالاً یکی از بزرگترین نقاط قوت این فناوری است. اگر کاملاً نمیدانید که در مورد یک بیمار چه میگذرد، میتوانید از او بخواهید که پنج تشخیص اصلی و استدلال درباره هر یک را ارائه دهد. بنابراین میتواند به شما کمک کند تا در مورد بیماری فکر کنید، اما در دادن پاسخ خوب نیست.»