ايتنا - هوش مصنوعی یا پزشک؛ کدام همدل‌تر است؟

ایتنا - صرف‌نظر از اینکه آیا هوش مصنوعی می‌تواند بهتر از پزشک به سوالات شما پاسخ دهد یا نه، در جایی که فکرش را هم نمی‌کردیم، بهتر از پزشک عمل کرد.

پژوهشگرانی که کیفیت و همدلی هوش مصنوعی را هنگام پاسخ دادن به سوالات بیمار بررسی می‌کردند، به نتایج جالب‌توجهی رسیدند. صرف‌نظر از اینکه آیا هوش مصنوعی می‌تواند بهتر از پزشک به سوالات شما پاسخ دهد یا نه، در جایی که فکرش را هم نمی‌کردیم، بهتر از پزشک عمل کرد: ربات هوشمند در مقایسه با همتای انسانی‌اش همدلی بیشتری با بیمار نشان داد.

نتایج یک مطالعه‌ که نشان می‌داد هوش مصنوعی (AI) نسبت به یک پزشک واقعی همدل‌تر برخورد کرده بود، سال ۲۰۲۳ منتشر شد. نشریه بهداشت دانشگاه هاروارد این مطالعه و نتایج آن را بررسی کرد تا ببیند آیا هوش مصنوعی واقعا بهتر از یک پزشک است و «چت جی‌پی‌تی» (یکی از سرویس‌های گفت‌وگوی هوشمند ساخت شرکت اوپن ای‌آی) از نظر شفقت و کیفیت مشاوره بهتر از پزشکان عمل می‌کند؟

در نگاه اول، این ایده که یک «بات گفت‌وگو» با استفاده از هوش مصنوعی بتواند به سوالات بیماران خوب پاسخ‌ دهد، تعجب‌آور نیست؛ اما اینکه بیشتر از پزشک همدلی نشان دهد چه؟ قبل از اعلام نظر نهایی در مورد کیفیت و همدلی هر دو طرف، اجازه دهید دوباره به این ماجرا نگاهی بیندازیم.

هوش مصنوعی در مراقبت‌های بهداشتی و پزشکی چه وظایفی را بر عهده می‌گیرد؟
در حال حاضر، فهرستی از کاربردهای پزشکی هوش مصنوعی وجود دارد که به‌سرعت در حال رشد است؛ این کاربردها عبارت‌‌اند از تهیه پیش‌نویس یادداشت‌های پزشک، پیشنهاد تشخیص، کمک به خواندن عکس‌های اشعه ایکس و اسکن‌های ام‌آر‌آی و نظارت هم‌زمان بر داده‌های سلامتی مانند ضربان قلب یا سطح اکسیژن.

اما اینکه پاسخ‌های تولید هوش مصنوعی ممکن است همدلانه‌تر از پزشکان واقعی باشد، شگفت‌انگیز و البته کمی ناراحت‌کننده بود. چگونه یک ماشین، حتی اگر بسیار پیشرفته‌ باشد، می‌تواند در نشان دادن فضیلتی انسانی از یک پزشک پیشی بگیرد؟

آیا هوش مصنوعی می‌تواند به سوالات بیمار پاسخ‌های خوبی بدهد؟
تصور کنید برای سوال در مورد یکی از داروهایتان با مطب پزشک تماس گرفته‌اید. در ادامه یک پزشک در تیم بهداشتی با شما تماس می‌گیرد تا در مورد این موضوع صحبت کنید. اکنون سناریو متفاوتی را تصور کنید: پرسشتان را از طریق ایمیل یا پیامک مطرح و در عرض چند دقیقه پاسخی دریافت کنید که یک رایانه با استفاده از هوش مصنوعی تولید کرده است. پاسخ‌های پزشکی در این دو موقعیت از نظر کیفیت چگونه با هم مقایسه می‌شوند؟ و چگونه می‌توانند از نظر همدلی نسبت به هم ارزیابی شوند؟

برای پاسخ به این سوالات، محققان ۱۹۵ پرسش و پاسخ از کاربران ناشناس یک شبکه اجتماعی آنلاین را جمع‌آوری و سوالات را به پزشکانی که داوطلب پاسخ دادن بودند، منتقل کردند. این سوالات در ادامه به چت جی‌پی‌تی ارسال و پاسخ‌های آن نیز جمع‌آوری شد.

سپس گروهی متشکل از سه پزشک یا پرستار هر دو مجموعه پاسخ‌ها را از نظر کیفیت و همدلی رتبه‌بندی کردند. مقیاس پنج درجه‌ای گزینه‌های رتبه‌بندی برای کیفیت عبارت بودند از: بسیار ضعیف، ضعیف، قابل قبول، خوب، یا بسیار خوب. گزینه‌های رتبه‌بندی برای همدلی هم این‌ها بودند: بدون همدلی، کمی همدلانه، نسبتا همدلانه، همدلانه و بسیار همدلانه.

یافته‌های مطالعه
نتایج حتی نزدیک هم نبود و در نزدیک به ۸۰ درصد موارد، پاسخ‌های چت جی‌پی‌تی بهتر از پزشکان ارزیابی شد.

پاسخ‌های با کیفیت خوب یا خیلی خوب‌ــ چت جی‌پی‌تی بابت ۷۸ درصد از پاسخ‌هایش این نمرات را دریافت کرد، در حالی‌ که پزشکان فقط در ۲۲ درصد از پاسخ‌ها این رتبه‌‌ها را گرفتند.

برای پاسخ‌های همدلانه یا بسیار همدلانه: چت جی‌پی‌تی ۴۵ درصد و پزشکان ۴.۶ درصد امتیاز گرفتند.

باید یادآوری کنیم که طول پاسخ‌‌های پزشکان (میانگین ۵۲ کلمه) بسیار کوتاه‌تر از چت جی‌پی‌تی (میانگین ۲۱۱ کلمه) بود.

همان‌طور که گفته شد، نتایج حتی نزدیک هم نبود اما زود نتیجه نگیرید؛ باید محدودیت‌های مهم این تحقیق را هم در نظر گرفت.

این مطالعه طوری طراحی نشده بود که به دو سوال کلیدی پاسخ دهد:

ــ آیا پاسخ‌های هوش مصنوعی اطلاعات پزشکی دقیقی هم ارائه می‌دهد که سلامتی بیمار را به او بازگرداند و از سردرگمی یا آسیب جلوگیری کند؟

ــ آیا بیماران این ایده را که یک ربات به سوالاتی که از پزشک‌ می‌پرسند، پاسخ دهد، می‌پذیرند؟

در ارزیابی و مقایسه پاسخ‌ها، ارزیابی‌کنندگان برای کیفیت و همدلی معیارهای ذهنی و آزمایش‌نشده‌ای را اعمال کردند. اما نکته این است که آن‌ها دقت واقعی پاسخ‌ها را ارزیابی نکردند و پاسخ‌ها از نظر ساختگی بودن هم ارزیابی نشدند؛ مشکلی که در چت جی‌پی‌تی دیده‌ شده است.

در پایان این پرسش مطرح است که آیا پزشکان می‌توانند در مورد ابراز همدلی از پاسخ‌های هوش مصنوعی بیاموزند؟ احتمالا بله. هوش مصنوعی می‌تواند به عنوان یک ابزار مشارکتی خوب عمل کند و پاسخ‌هایی خلق کند که یک پزشک بتواند از آن‌ها پس از بررسی و بازبینی، استفاده کند. در واقع، هم‌اکنون نیز برخی سیستم‌های پزشکی از هوش مصنوعی به این روش استفاده می‌کنند.

با این حال به نظر می‌رسد که تکیه کردن بر پاسخ‌های هوش مصنوعی برای پاسخ به سوالات بیماران، بدون تاییدیه و نظارت واقعی متخصصان مراقبت‌های بهداشتی هنوز زود است.

حتی خود چت جی‌پی‌تی نیز با این نتیجه‌گیری موافق است. وقتی از چت جی‌پی‌تی پرسیده شد که آیا می‌تواند بهتر از یک پزشک به سوالات پزشکی پاسخ دهد؟ جوابش منفی بود.