۲
plusresetminus
شنبه ۲۹ ارديبهشت ۱۳۹۷ ساعت ۱۲:۳۴

دستیار صوتی هوشمند را بهتر بشناسیم

ایتنا- با توجه به دیجیتالی شدن زندگی روزمره، دیگر دستیار‌های شخصی هم دیجیتالی شده و نیاز به دستیارهای انسانی کم‌تر احساس می‌شود. پنج شرکت بزرگ فناوری هم برای سلطه به این بازار، دستیار صوتی دیجیتالی خود را معرفی کرده‌اند.
دستیار صوتی هوشمند را بهتر بشناسیم
با گسترش هرچه بیش‌تر فناوری، زندگی ما هم بیش از پیش به سمت دیجیتالی شدن پیش می‌رود.
هم‌اکنون به راحتی و با هزینه‌ای اندک، می‌توانید دستیار دیجیتالی شخصی خود را که تمام و کمال و به صورت ۲۴ ساعته در اختیار شما باشد، در اختیار داشته باشید، دستیاری که فقط نیازمند اینترنت و دستگاه‌های هوشمند است.
در این مقاله با مفاهیم و مقایسه دستیارهای صوتی هوشمند آشنا می‌شوید.


پنج قدرت دنیای فناوری اطلاعات(اپل، مایکروسافت، آمازون، فیس بوک و گوگل) در حال حاضر دستیارهای شخصی خود را به کاربران پیشنهاد می‌دهند که بیشتر وظایف خسته کننده‌ یک دستیار واقعی را با گوش دادن به فرمان‌های صوتی یا اجرای فرمان‌های متنی کاربر خود در دستگاه‌های هوشمند مختلف انجام می‌دهند.
همراه ما باشید تا در این مقاله با دستیار شخصی هر یک از این شرکت‌ها آشنا شوید و آن‌ها را مورد آزمایش قرار دهیم.

دستیار صوتی هوشمند

سیری : دستیار صوتی سیری (Siri) اپل که اولین و شناخته شده‌ترین دستیار شخصی است، از سال ۲۰۱۱ در دسترس کاربران سیستم ‌عامل iOS قرار دارد.

کورتانا : شرکت مایکروسافت هم با ارائه‌ دستیار جذاب خود تحت عنوان کورتانا (Cortana) برای سیستم عامل‌های ویندوز ۱۰، اندروید و بزودی برای iOS ، قصد رقابتی تنگاتنگ با دیگر غول‌های دنیای فناوری را در سر دارد.

آلکسا: شرکت آمازون نیز به وسیله دستیار صوتی خود که با اسپیکر Echo ادغام کرده و نام الکسا (Alexa) را برای آن برگزیده است، قصد ورود به دنیای اینترنت اشیاء را دارد.

M : از طرفی شرکت فیس بوک در حال آزمایش و توسعه‌ دستیار کنترل صوتی خود تحت عنوان اِم (M) بوده و در این زمینه فعال است.

Google Now : شرکت گوگل هم دستیار کنترل صوتی ناو (Google Now) را با نرم‌افزار جستجوی موجود در سیستم‌عامل اندروید ادغام کرده است.

در ادامه به انتشار گزارش‌های مربوط به بررسی دستیارهای کنترل صوتی هوش مصنوعی این شرکت‌ها میپردازیم.
برای آزمایش کردن هر یک از دستیارهای کنترل صوتی از ۱۶ درخواستی که عموماً بیشتر کاربران از آن استفاده کرده و کاربردی هستند، استفاده شد. این درخواست‌ها در دسته‌بندی‌هایی همچون موسیقی، میزان سودمندی، سیر و سیاحت، خوراک، سرگرمی و علایق شخصی مانند ورزش قرار دارند.

بررسی عملکرد دستیارهای صوتی
الکسا به پرسش‌های مربوط به دنیای ورزش پاسخ مناسبی نداد.
سیری در انجام وظایف سودمندی مانند تنظیم قرار ملاقات‌های موجود در تقویم و ایمیل، عملکرد قدرتمندی از خود نشان داد.
گوگل ناو هم در انجام کارهای مربوط به سیر و سفر برترین بود.
دستیار صوتی الکسا در حوزه‌ی موسیقی برتری خود را اثبات کرده و کورتانا هم در تمامی دسته‌بندی‌ها عملکرد متوسطی از خود بر جای گذاشت.
به دلیل عدم دسترسی شرکت آزمایش‌کننده به دستیار دیجیتالی M، این دستیار در سیستم رتبه‌بندی ما قرار ندارد. اما با پافشاری بیش‌تر توانستیم با استفاده از حساب کاربری ویژه‌ای به مدت دو ساعت آن را به چالش بکشیم تا حداقل به بخشی از عملکردهای آن در این مقاله اشاره‌ای داشته باشیم.

شرکت‌های یاد شده، اظهار نظرهای مختلفی در مورد دستیارهای شخصی دیجیتالی خود داشته‌اند.
اپل اظهار می‌کند که سیری باهوش‌تر و سریع‌تر بوده و به زبان‌های بیشتری نسبت به سایر دستیارها مسلط است.
مایکروسافت هم کمک‌رسانی کورتانا در بیش‌تر موارد روزمره را به رخ رقبا می‌کشد.
گوگل ادعا کرده با ارائه‌ی دستیار صوتی هوشمند خود، گوشی‌های هوشمند کارهایی فراتر از وظایف عادی یک تلفن همراه را با صحبت با گوگل ناو انجام خواهند داد.
شرکت آمازون فعلا هیچ اظهار نظری در این رابطه نداشته است.

برتری‌های هر یک از دستیارهای هوشمند
سیری با نگه داشتن چند ثانیه‌ای دکمه‌ی هوم در آیفون یا با گفتن عبارت "هی سیری" (Hey, Siri) احضار می‌شود.
در مبحث سودمندیِ سیری، دستیار اپل دارای توانایی‌های برتری در زمینه‌ برنامه‌ریزی قرار ملاقات در مکانی مشخص، بررسی رویدادهای موجود در تقویم روزهای آینده، ارسال یک ایمیل و خواندن آخرین ایمیل‌ها با صدای بلند بود. دستیارهای دیجیتالی دیگر، فقط قادر به انجام برخی از این کارها هستند. برای مثال، گوگل ناو قادر به بازخوانی آخرین ایمیل با صدای بلند نیست. همچنین الکسا نمی‌تواند ایمیل جدیدی برای ارسال ایجاد کرده یا رویداد جدیدی را در تقویم ثبت کند.

سیری در زمینه‌ی موسیقی هم عملکرد خوبی داشت، اما الکسا پیروز میدان شد. هر دو دستیار قادر به پخش آهنگ Hey از کارهای the Pixies، پخش موسیقی از نوع اینسترومنتال (instrumentals) و پخش آخرین پادکست وبسایت‌های معتبر بودند. اما الکسا که با صدا زدن اسم آن فراخوانی می‌شود، قادر به پخش ایستگاه موسیقی ویژه‌ای در پاندورا بود؛ در حالی که سیری فقط قادر به اجرای نرم‌افزار پاندورا بود.

بالاترین امتیاز کسب شده به وسیله‌ی گوگل ناو، مربوط به سیر و سفر و نقشه یابی است. گوگل ناو با نمایش دادن مدت زمان مورد نیاز برای رانندگی به سوالی در مورد میزان ترافیک خیابان مورد نظر ما پاسخ داد. هنگامی که درخواست هدایت به سمت باشگاه ورزشی مورد نظرمان را از گوگل ناو کردیم، نقشه‌ی آن را همراه با راهنمای صوتی در اختیار ما گذاشت. پاسخ گوگل ناو به درخواست ما، مبنی بر یافتن بلیط هواپیما به مقصد کشوری خاص بسیار جالب و گیرا بود! پاسخ گوگل ناو چنین بود: پروازهای مربوط به مسیر سانفرانسیسکو به نیویورک در هفته‌ی بعد، از ۴۳۵ دلار شروع شده و کوتاه‌ترین پرواز، ۵ ساعت و ۱۰ دقیقه طول خواهد کشید.

کورتانا در بخش سیر و سیاحت، در مورد پروازها ناتوان بوده و پاسخ آن فقط سفرهای زمینی را شامل می‌شود.

سیری قادر به تخمین میزان ترافیک نبوده و در پاسخ به درخواست بلیط برای پرواز به نیویورک، فقط لیست غیر مفید مربوط به مسافرت به نیویورک را با استفاده از نتایج جستجوی وب، به نمایش گذاشت. همچنین در راهنمایی ما به سمت مکان مورد نظر، مکان اشتباهی را پیشنهاد داد. بنابراین هنوز لازم بود که دستیار صوتی هوشمند خود را ارتقا دهیم.

ویژگی های دستیار صوتی هوشمند

الکسا که رتبه‌ی چهارم را از آن خود کرد، قادر به تخمین میزان ترافیک و افزودن برنامه‌ی پرواز ما به لیست کارهایی که در آینده قصد انجام آن را داشتیم، بود. الکسا هم در مورد هدایت و نشان دادن نقشه‌ی مکان مورد نظر ما، ناموفق بود. اما به نظر شما این سوال از یک دستیار صوتی هوشمند خانگی، زیادی به نظر نمی‌رسد؟! با این حال، شاید بتوان این ناکارآمدی را به پای تازه وارد بودن آن گذاشت.

در مورد خوراک، گوگل ناو و سیری عملکرد مشابهی داشتند. هر دو دستیار صوتی هوشمند قادر به یافتن لیست رستوران‌های هندی نزدیک بودند. اما فقط گوگل ناو موفق به سفارش غذا شد، البته آن هم طی فرآیندی غیرمستقیم که نیازمند نام رستوران ویژه‌ای بود که با یکی از نرم‌افزارهای شرکت گوگل قرارداد همکاری داشت. اگر چه سیری اپل فقط قادر به رزرو میز رستوران بود.

در مورد علایق شخصی، سوال منصفانه و بسیار صریحی را در مورد برنده مسابقه‌ی فوتبال هفته‌ گذشته و تیمی که در بازی آینده خواهد بود، از هر کدام از دستیارهای دیجیتالی پرسیدیم. گوگل ناو، کورتانا و سیری، امتیازهای بازی لیگ ملی فوتبال هفته‌ پیش را نمایش دادند. اما فقط گوگل ناو و کورتانا قادر به مشخص کردن تیم‌های موجود در بازی هفته آینده بودند. درحالی که سیری فقط به تاریخ و مکان دقیق بازی اشاره کرد. الکسا هم در مورد سوالات مربوط به ورزش، کاملا ساکت ماند!

حالا نوبت به دستیار دیجیتالی M که به وسیله‌ شرکت فیسبوک توسعه داده شده، می‌رسد. دسترسی و آزمایش اِم بسیار سخت بود و فقط تعداد اندکی از آزمایش کننده‌ها به آن دسترسی مستقیم داشتند. به همین دلیل برای دسترسی به ام، از یک حساب کاربری دارای امتیاز ویژه‌ی مربوط به مسنجر فیسبوک استفاده کردیم. به گفته‌ کارکنان رده بالای شرکت، دستیار دیجیتالی ام، هم به وسیله‌ی هوش مصنوعی و هم از طریق نیروهای انسانی کنترل می‌شود. تنها راه ارتباط با این دستیار، ارسال پیام‌های مورد نظر کاربر از طریق نرم‌افزار پیام رسان مسنجر (Messenger) فیسبوک است. مانند زمانی که پیامی را برای یکی از دوستان خود ارسال می‌کنید.
در مدت زمان محدود کار با "ام" درخواست‌های مختلفی مربوط به کارهای مادی روزمره از او کردیم. برقراری تماس با شرکت آب و فاضلاب و پرسش در مورد قبض مربوطه، انواع گوشت‌های فروشی موجود در همه‌ فروشگاه‌های مواد غذایی محلی و ارزان‌ترین زمان برای پرواز به کشور مورد نظر، مثال‌هایی از درخواست‌های ما بود.

دستیار ام برای پاسخ به این پرسش‌ها، چند دقیقه به فکر فرو رفت؛ که ما را بیش از پیش متقاعد به وجود نیروی انسانی برای پاسخ‌گویی کرد. ام دقیقاً مانند یک شخص، با کمی فکر کردن به سوالات جواب می‌داد. بنابراین تصمیم گرفتیم تا ام را بیش‌تر به چالش بکشیم. پس از درخواست برنامه‌ریزی عکاسی با یک لابراتوار آشنا، دستیار ام در عرض چند دقیقه با لابراتوار تماس برقرار کرد و دوست ما گوشی را برداشت. دستیار ام برای یافتن شماره‌ی لابراتوار مورد نظر، تعداد فراوانی از شماره‌های تماس را بررسی کرد.
 دستیار ام شروع به صحبت کرد:
سلام، من درحال تماس از طرف کارفرمای خود هستم. آیا می‌توانید ساعت ۲ بعد از ظهر فردا را به ایشان اختصاص دهید؟
دوست ما: نام شما را متوجه نشدم. لطفا خود را معرفی کنید.
دستیار ام: نام من اِم و نام خانوادگی من مسنجر است.
دستیار ام در پاسخ به این که آیا اهل کشور یونان هستید، فقط با حالت خاصی خندید.
به عبارت دیگر، شاید ام به دلیل همکاری نیروهای انسانی با هوش مصنوعی، از دیگر دستیارهای دیجیتالی توانایی بیش‌تری داشته باشد.
شرکت فیسبوک در گزارش اخیر خود اظهار کرده که دستیار ام فعلا در مراحل اولیه‌ی توسعه نرم‌افزاری قرار داشته و هنوز هیچ برنامه‌ای برای انتشار عمومی در سطح گسترده نداریم.

نتیجه مقابیسه دستیارهای صوتی
در پایان باید بگوییم که متاسفانه هیچ کدام از دستیارهای صوتی، نتیجه‌ی رضایت بخشی که بتواند کاربر خود را سربلند کند، به دست نیاوردند و هر یک از دستیارهای دیجیتالی به نوبه‌ی خود کاستی‌هایی را به همراه داشتند. در ادامه می‌توانید نتیجه‌ی امتیازبندی دستیارهای صوتی را از مجموع ۴ امتیاز، مشاهده کنید.

- گوگل ناو (گوگل): ۳.۱
- سیری (اپل): ۲.۹
- کورتانا (مایکروسافت): ۲.۳
- الکسا (آمازون): ۱.۷

با اینکه هوش مصنوعی هنوز در مراحل ابتدایی است و هنوز به یک فناوری عجیب و تخیلی تبدیل نشده، اما شاهد قرار گرفتن آن در دستیار صوتی هوشمند گوشیهای خود هستیم. از گوگل گرفته تا هواوی، آمازون، اپل و سامسونگ سعی کرده‌اند به کمک هوش مصنوعی، دستیار اختصاصی خود را طراحی و در محصولاتشان قرار دهند. تحولی که شاید تا چند دهه پیش تنها در فیلمهای تخیلی شاهد آن بودیم.

جمع‌بندی
در پایان باید بگوییم که دستیار هوشمند صوتی نیز مانند تمامی نوآوری‌های دیگر تا کنون با کمی‌ها و کاستی‌های زیادی روبرو بوده و در حال تکمیل است. هر روز بر قابلیت‌های آن افزوده می‌شود و احتمال می‌رود که در آینده‌ای نه چندان دور شاهد ورود دستیارهای هوشمند صوتی قدرتمندی به بازار باشیم.

    مطالب مرتبط:
    - راهنمای استفاده از کورتانا، دستیار صوتی مایکروسافت
    - هوش مصنوعی چیست و چه کاربردهایی دارد؟
 
کد مطلب: 52885
نام شما
آدرس ايميل شما

بنظر شما مهم‌ترین وظیفه دولت جدید در حوزه IT چیست؟
حمایت از بخش خصوصی حوزه فاوا
افزایش سرعت اینترنت
کاهش تعرفه اینترنت
رفع فیلترینگ