کامپیوترها تا چه اندازه در تشخیص چهره ها موفق هستند؟
ایتنا - در سال ۲۰۱۲ صاحبان بزرگترین دیتابیس چهره (فیسبوک) در جهان یاد گرفتند که چگونه تصویر صورت یک شخص را از یک منظره تشخیص دهند.
شبکههای اجتماعی در عکسها به دنبال چهره میگشتند و ناحیه صورت را تگ میکردند. اما گاهی اوقات اشتباه صورت میگرفت. حالا بعد از چهار سال فیسبوک برای شناسایی تصویر در عکس ،دقتی به اندازه ۹۷% دارد.
این یک پیشرفت بزرگ برای فیسبوک است اما این الگوریتم هنوز به اندازه مغز انسان نمیرسد و ۳ درصد امکان خطا برایش وجود دارد. حالا اگر شخصی از ما بخواهد یک چهره آشنا را در عکسی با کیفیت پایین شناسایی کنیم قطعا این کار را بهتر از کامپیوترها انجام خواهیم داد. حتی اگر این عکس از یک زاویه خیلی بد گرفته شده باشد.
همیشه کامپیوترها دقیقتر از انسانها عمل میکنند و برای این موضوع کمی غیرمعمول است که قدرت تشخیص انسان بهتر است. چرا ما در این چالش بهتر عمل میکنیم و رایانهها دقیقا چگونه چهره را تشخیص میدهند؟
مغز ما از قبل آموزشی جدی دیده است یک قسمت از مغز ما به تشخیص چهره اختصاص داده شده است. این قسمت fusiform gyrus نامیده میشود که این قسمت بخشی از temporal lobe و occipital lobe را شامل میشود. یادگیری تشخیص چهره انسان از زمان تولد آغاز میشود. این مهارت در روز اول زندگی نوزادان در آنها پرورش مییابد. در اوایل چهارماهگی، مغز نوزادان آماده است که مثلا چهره عمو را از چهره عمه یا هر شخص دیگر تمیز دهد.
چشم، استخوان گونه، بینی، دهان و ابرو قسمتهای کلیدی صورت هستند که به ما کمک میکنند یکدیگر را از هم تشخیص دهیم. البته پوست هم خیلی مهم است مخصوصا رنگ و بافت آن. قابل ذکر است که مغز ما تمایل دارد کل یک چهره را پردازش کند و عمدتا بر روی ویژگیهای فردی تمرکز نمیکند.
با وجود این قابلیت است که میتوانیم یک چهره نیمه آشکار و یا چهره زیر روسری یا چادر را تشخیص دهیم. با این حال، اگر یک شخص شبیه یکی دیگر را با اختلاف خیلی کم و یا چهره شخص معروف را ببینیم ممکن است برای تشخیص چهره به عکس دیگری احتیاج پیدا کنیم. از زمان تولد مغز ماچهرهها را در خود ذخیره میکند و این ذخیرهها است که برای پردازش صورت استفاده میشود. اگر یک نفر بخواهد این الگو را رسم کند ممکن است شبیه عکس زیر باشد:
پردازش صورت زمانی صورت میگیرد که مغز ما بخواهد ظاهر یک فرد را با چیزی که از قبل در خود ذخیره کرده، مقایسه کند. مثلا اگر بینی شخص بزرگتر، لبها کوچکتر یا بزرگتر، پوست تیرهتر یا روشنتر و ... شده باشد مغز فرمان پردازش میدهد. تا بهحال برایتان پیش آمده که به سفر بروید و اشخاصی را ملاقات کنید که شبیه کسانی بودند که آنان را دیدهاید ولی با نژاد متفاوت ؟ دلیل این موضوع قالب صورت و نقاط کلیدی صورت است که میتواند شبیه آنها بنظر برسد.
برخی از حیوانات هم مثل سگ و میمون میتوانند چهره ها را به خوبی از هم تشخیص دهند. اگرچه مشام قوی آنهاست که میتواند اطلاعات مفیدی در این باره به آنها بدهد اما تصاویر بصری این حیوانات است که به آنها کمک می کند تا چهرهها را در بین سایر موجودات زنده دیگرتشخیص دهند. جالب است بدانید که سگ که بهترین دوست اکثر افراد است، نه تنها خلق و خو را به آسانی در چهرههای ما میتواند ببیند بلکه آنها میتوانند یاد بگیرند که چگونه لبخند بزنند.
چگونه یک کامپیوتر چهره ما را تشخیص میدهد؟ چه ارتباطی بین لبخند انسان و پردازش صورت وجود دارد؟ این دو عبارت تقریبا لازمه شناسایی چهره هستند(خصوصا برای الگوریتم های کامپیوتر) که با هر تغییری بتواند شناسایی را به طور کامل انجام دهد.
نرمافزار میتواند دو تصویر صورت تمام رخ را باهم مقایسه و تصویر واقعی شخص را از نقاشی تشخیص دهد. این راهکار دقیقا مثل طراحی چهرهسازی است. آنها نقطه به نقطه صورت را آنالیز میکنند. این نقاط به شناسایی چهره فردی ما کمک میکند. روشهای مختلفی برای تشخیص چهره وجود دارد که از ۸۰ تا ۱۵۰ نقطه بر روی چهره قابل تغییر است. برای مثال، هنرمندان چهرهساز و نرمافزار هردو فاصله بین چشمها، پهنای بینی، عمق کاسه چشم، شکل استخوان گونه، طول خط فک و... همه را اندازهگیری میکنند.
هنگاهی که حالت چشمتان را تغییر دهید یا مدل سرتان را مثلا کج بگیرید، تمام اندازهگیریها تغییر میکند. همانطور که بسیاری از الگوریتمهای پردازش صورت در فضای دو یا سه بعدی آنالیز میشوند. نقطه دید برای شناسایی چهره بسیار مهم است.
اگر قصد دارید ناشناس بمانید و کسی نتواند شما را تشخیص دهد، چشم هایتان را بپوشانید و استخوان گونه خود را زیر عینک بزرگ مخفی کنید، چانه و دهان خود را برای حفظ گمنامی با یک شال گردن بپوشانید.هنگامی که ما دستگاه FindFace را مورد آزمایش قرار دادیم، آن فقط قادر بود چهره هایی که از جلو نمایان بودند را تشخیص دهد. تصاویر بالا به شما میگوید که چگونه بتوانید دستگاههای تشخیص چهره را که تنها با عکسهای یک بعدی کار می کنند را گول بزنید. با این حال ماه پشت ابر نمیماند و الگوریتمهای پیشرفته برای تشخیص چهره در راه هستند.
گام بعدی چیست؟ همزمان با رشد ما، آن قسمت از مغزمان هم که برای پردازش چهره است رشد میکند. توانایی تشخیص افراد بین "ما" و "شما" یکی از مهارت های ضروری برای بقا است. کامپیوتر های مدرن هم مانند یادگیری مغز انسان، برنامه ریزی خود را دارند. برای پیشرفت نتایج سیستم پردازش صورت، توسعهدهندگان با استفاده از الگوریتمهای یادگیری خود و ...برای شناسایی عکس، راههای آنلاین مختلفی وجود دارد و این کار بهراحتی انجام میگیرد. شبکههای اجتماعی،سایتهای هاستینگ عکس، photo stocks و بسیاری از منابع دیگر هستند که با استفاده از آنها میتوانید عمل شناسایی چهره را روی آنها انجام دهید.
شناسایی چهره از زمانی که الگوریتمها با مدلهای سهبعدی شروع به کار کردند، بسیار کارآمدتر از قبل شده است. با پیشرفت برنامهنویسی، طراحی یک شبکه بر روی چهره و ادغام ضبط ویدئو با نرمافزارهای مختلف تشخیص چهره ، شناسایی شخص از زوایای مختلف امکانپذیر شده است. به هر حال، قالب چهره در مغز انسان هم سهبعدی میباشد. اگرچه این تکنولوژی همچنان در حال توسعه میباشد اما میتوان برای آن چند راه اختصاصی در بازار پیدا کنید.
واقعی بودنِ رندر، مانند یک معدن طلا برای صنعت بازیهای ویدئویی و شرکتهای نامبر وانی میباشد که به سختی تلاش میکنند کاراکترهای خود را هرچه بیشتر طبیعی نشان دهند. گامهای مهمی در این عرصه برداشته شده است. این تکنولوژی خدمت مهمی به نرمافزارهای تشخیص چهره میباشد.
جدا از مدل های سهبعدی، توسعه دهندگان در قالبهای دیگری نیز فعالیت کردهاند، برای مثال: شرکت Identix یک تکنولوژی بیومتریک برای تشخیص چهره ایجاد کرد که آن را FaceIt Argus نامید. این شناساگر منحصربه فرد؛ بافت پوست، منافذ پوست، زخمها و چیزهایی نظیر اینها را آنالیز میکند. سازندگان FaceIt Argus مدعی شدهاند که شناساگر آنها قابلیت این را دارد که تفاوت بین دوقلوهای همسان را نیز تشخیص دهد. که چنین چیزی با استفاده از نرمافزارهای تشخیص چهره یه تنهایی ممکن نیست. گفته میشود این سیستم نسبت به تغییرات چهره (مانند چشمک زدن، خنده یا اخم) حساس نیست و قابلیت این را دارد که برای فرد ریش و سبیل بگذارد و وی را به اصطلاح عینکی کند. دقت شناسایی را از ۲۰ تا ۲۵% میتوان توسط نرمافزار FaceIt Argus به همراه دیگر نرمافزارهای پردازش چهره افزایش داد. از سوی دیگرضعف این نرمافزار در تاریکی خودش را نشان میدهد و در تصاویر با کیفیت پایین و نور کم با شکست مواجه شده است.
به هر حال، برای پوشش این ایراد فناوریهای دیگری نیز وجود دارد. دانشمندان کامپیوتر در موسسه تکنولوژی Karlsruhe در آلمان روش جدیدی را توسعه دادند که با استفاده از مادون قرمز چهره افراد، در نور کم و یا حتی در تاریکی چهره را شناسایی میکند.
این تکنولوژی امضای حرارتی افراد را آنالیز میکند و با دقت نهایتاً 80% ، تصاویر "مادون قرمز دور" فرد را با تصاویر معمولی تطبیق میدهد. هرچقدر تعداد تصاویر بیشتر باشد عملکرد الگوریتم موفقیتآمیزتر خواهد بود. زمانی که تعداد تصاویر قابل رویت تنها یک عدد باشد، دقت الگوریتم به 55% کاهش مییابد. ساخت چنین نرمافزاری در نگاه اول آسان بنظر نمیرسد ، زیرا که هیچ رابطهای بین چهره و مادون قرمز وجود ندارد. عکسی که براساس انتشار حرارتی ساخته شده است، از عکسهایی که در روشنایی روز گرفته میشوند بسیار متفاوت است.
قدرت این الگوریتم وابستگی زیادی به پوست، دمای محیط و حتی حالت احساسی فرد دارد. در کنار آن، تصاویر مادون قرمز رزولوشن کمتری نسبت به تصاویر معمولی دارند که این امر کار را سختتر میکند. برای حل این مشکل، دانشمندان از "الگوریتم یادگیری ماشین" استفاده کردند و ۱۵۸۶ تصویر از ۴۲ نفر را وارد این سیستم کردند.
امروزه، فناوری تشخیص چهره تقریبا در سراسر جهان استفاده میشود. اخیرا یکی از راههای مشابه تشخیص چهره در چین برای کنترل رانندگان تاکسی به کار برده میشود. NEC و مایکروسافت هم ترکیبی از تشخیص چهره را در نرمافزارهایشان استفاده میکنند و IoT به متخصصان بازاریابی اجازه میدهد که از این طریق مشتریان خود را بهتر و بهتر بشناسند. توسعه فناوری تشخیص چهره میتواند به ما کمک کند تا در مورد هر چیز که به حریم شخصی ما مربوط است تجدید نظر کنیم. ممکن است چنین چیزی امروز و یا حتی در سال آینده هم اتفاق نیوفتند اما در حال حاضر باید برای آن آماده بود.