ايرنا - دولتها و شركتهاي بزرگ ميبايد دائما مطالبي را كه درباره آنها در رسانهها انتشار مييابد دنبال كنند، اما اين كار با توجه به شمار بسيار زياد رسانههاي مكتوب، تقريبا غيرممكن شده است.
اكنون يك شركت انگليسي نرمافزاري را به بازار عرضه كرده كه ميتواند به صورت خودكار محتواي مطالبي را كه درباره يك نهاد خاص در رسانههاي الكترونيك درج شده بررسي كند و مشخص سازد آيا مطالب مطروحه ارزيابي مثبتي ارائه ميدهند يا تصويري منفي نشان ميدهند.
تا قبل از ابداع نرمافزار جديد، وظيفه ارزيابي محتواي رسانهها بر عهده گروههاي كارشناساني بود كه هر آنچه را كه درباره يك شركت يا نهاد منتشر ميشد مطالعه ميكردند و گزارشي از محتواي اين مطالب را به صورت مستمر در اختيار مسوولان شركت يا نهاد قرار ميدادند.
به گفته نيك ژاكوبي مدير تحقيق شركت انگليسي كورپورا، اين روش علاوه بر هزينه زيادي كه در بر دارد كند و زمانبر است زيرا حجم اطلاعات موجود بسيار زياد است بطوريكه تنها يك آژانس خبري ميتواند در هر ساعت هشت يك گزارش يا خبر درباره يك شركت يا نهاد يا موسسه انتشار دهد و به اين ترتيب تنها همين يك آژانس ميتواند روزانه حدود ۲۰۰مطلب در مورد يك شركت عرضه كند.
تلاشهايي كه در گذشته براي بررسي خودكار اين قبيل مطالب به انجام رسيده بود عمدتا متكي به دو شيوه بود. در شيوه اول كه "تربيت ماشين براي يادگيري" نام دارد نرم افزار مورد استفاده با استفاده از هزاران نمونه از مقالات موجود به گونهاي "تربيت" ميشد كه ميان مطالبي كه برايش تنظيم شده به صورت خودكار ارتباط برقرار كند.
محدوديت اين روش در آن است كه چون قضاوتهاي مورد نظر از پيش به ماشين (كامپيوتر و نرماافزار) تغذيه ميشود، دستگاه ميتواند در برخورد با موارد جديد مرتكب خطا در قضاوت شود.
به عنوان نمونه اگر نرمافزار به گونهاي تنظيم شده باشد كه در مورد انفجارهاي بمب در مساجد عراق واكنش نشان دهد، آنگاه اين شيوه يادگيري ميتواند موجب گردد كه نرمافزار هر بار كه با واژه مسجد برخورد ميكند قضاوتي منفي درباره آن ارائه دهد.
روش دوم موسوم به روش واژگان متكي به اين رويكرد است كه شماري از واژگان به عنوان واژگان داراي بار مثبت يا بار منفي به نرمافزار آموخته ميشود و نرمافزار در ميان متون مختلف به دنبال اين واژگان ميگردد.
اما اين روش نيز با اين محدوديت مواجه است كه در بسياري از موارد معناي واژگان مورد نظر با توجه به ظرف و زمينه ميتواند متفاوت از مدلولي باشد كه به ماشين آموخته شده است.
شركت كورپورا براي حل مشكل، نرمافزار تازهاي به نام سنتيمنت Sentiment را تكميل كرده كه از يك آلگوريتم مناسب براي مشخص ساختن اجزاي دستوري عبارت نظير نامها، صفات، قيود، افعال، فاعل، مفعول، ضماير و حروف اضافه استفاده ميكند.
به نرمافزار اطلاعات لازم درباره ساختارهاي دستوري داده شده و نرمافزار با استفاده از اين دانش، همه آنچه را كه در يك عبارت غيرضروري تشخيص ميدهد تصفيه ميكند و با تكيه به بافتار عبارت از افتادن به تله ايهام يا ابهام معنايي حذر ميكند.
ژاكوبي اذعان دارد كه نرمافزار تازه در مواردي نيز دچار اشتباه مي شود اما تاكيد دارد كه انسانها نيز دچار چنين اشتباهاتي ميشوند.
آزمايش نشان ميدهد كه بازده موفقيت اين نرمافزار معادل ۸۰درصد از مواردي است كه متخصصان و كارشناسان در مورد آن به نظر واحدي دست مييابند.
به گفته ژاكوبي در استفاده از اين نرمافزار همچنين به كمك انسان نياز است زيرا در نهايت ميبايد يك متخصص گزارش تهيه شده به وسيله نرمافزار را قرائت كند و درباره آن تصميم بگيرد. اما مزيت اين نرمافزار آنست كه به كارشناسان اجازه ميدهد موضوعات را بر حسب درجه اهميتشان تنظيم كنند و به آنها اولويت بدهند.