ايتنا - نرم‌افزار بررسي و ارزيابي موضوعات در اينترنت

ايرنا - دولت‌ها و شركت‌هاي بزرگ مي‌بايد دائما مطالبي را كه درباره آنها در رسانه‌ها انتشار مي‌يابد دنبال كنند، اما اين كار با توجه به شمار بسيار زياد رسانه‌هاي مكتوب، تقريبا غيرممكن شده است. اكنون يك شركت انگليسي نرم‌افزاري را به بازار عرضه كرده كه مي‌تواند به صورت خودكار محتواي مطالبي را كه درباره يك نهاد خاص در رسانه‌هاي الكترونيك درج شده بررسي كند و مشخص سازد آيا مطالب مطروحه ارزيابي مثبتي ارائه مي‌دهند يا تصويري منفي نشان مي‌دهند. تا قبل از ابداع نرم‌افزار جديد، وظيفه ارزيابي محتواي رسانه‌ها بر عهده گروه‌هاي كارشناساني بود كه هر آنچه را كه درباره يك شركت يا نهاد منتشر مي‌شد مطالعه مي‌كردند و گزارشي از محتواي اين مطالب را به صورت مستمر در اختيار مسوولان شركت يا نهاد قرار مي‌دادند. به گفته نيك ژاكوبي مدير تحقيق شركت انگليسي كورپورا، اين روش علاوه بر هزينه زيادي كه در بر دارد كند و زمان‌بر است زيرا حجم اطلاعات موجود بسيار زياد است بطوريكه تنها يك آژانس خبري مي‌تواند در هر ساعت هشت يك گزارش يا خبر درباره يك شركت يا نهاد يا موسسه انتشار دهد و به اين ترتيب تنها همين يك آژانس مي‌تواند روزانه حدود ‪۲۰۰‬مطلب در مورد يك شركت عرضه كند. تلاش‌هايي كه در گذشته براي بررسي خودكار اين قبيل مطالب به انجام رسيده بود عمدتا متكي به دو شيوه بود. در شيوه اول كه "تربيت ماشين براي يادگيري" نام دارد نرم افزار مورد استفاده با استفاده از هزاران نمونه از مقالات موجود به گونه‌اي "تربيت" مي‌شد كه ميان مطالبي كه برايش تنظيم شده به صورت خودكار ارتباط برقرار كند. محدوديت اين روش در آن است كه چون قضاوت‌هاي مورد نظر از پيش به ماشين (كامپيوتر و نرم‌اافزار) تغذيه مي‌شود، دستگاه مي‌تواند در برخورد با موارد جديد مرتكب خطا در قضاوت شود. به عنوان نمونه اگر نرم‌افزار به گونه‌اي تنظيم شده باشد كه در مورد انفجارهاي بمب در مساجد عراق واكنش نشان دهد، آنگاه اين شيوه يادگيري مي‌تواند موجب گردد كه نرم‌افزار هر بار كه با واژه مسجد برخورد مي‌كند قضاوتي منفي درباره آن ارائه دهد. روش دوم موسوم به روش واژگان متكي به اين رويكرد است كه شماري از واژگان به عنوان واژگان داراي بار مثبت يا بار منفي به نرم‌افزار آموخته مي‌شود و نرم‌افزار در ميان متون مختلف به دنبال اين واژگان مي‌گردد. اما اين روش نيز با اين محدوديت مواجه است كه در بسياري از موارد معناي واژگان مورد نظر با توجه به ظرف و زمينه مي‌تواند متفاوت از مدلولي باشد كه به ماشين آموخته شده است. شركت كورپورا براي حل مشكل، نرم‌افزار تازه‌اي به نام سنتيمنت ‪Sentiment‬ را تكميل كرده كه از يك آلگوريتم مناسب براي مشخص ساختن اجزاي دستوري عبارت نظير نام‌ها، صفات، قيود، افعال، فاعل، مفعول، ضماير و حروف اضافه استفاده مي‌كند. به نرم‌افزار اطلاعات لازم درباره ساختارهاي دستوري داده شده و نرم‌افزار با استفاده از اين دانش، همه آنچه را كه در يك عبارت غيرضروري تشخيص مي‌دهد تصفيه مي‌كند و با تكيه به بافتار عبارت از افتادن به تله ايهام يا ابهام معنايي حذر مي‌كند. ژاكوبي اذعان دارد كه نرم‌افزار تازه در مواردي نيز دچار اشتباه مي شود اما تاكيد دارد كه انسان‌ها نيز دچار چنين اشتباهاتي مي‌شوند. آزمايش نشان مي‌دهد كه بازده موفقيت اين نرم‌افزار معادل ‪۸۰‬درصد از مواردي است كه متخصصان و كارشناسان در مورد آن به نظر واحدي دست مي‌يابند. به گفته ژاكوبي در استفاده از اين نرم‌افزار همچنين به كمك انسان نياز است زيرا در نهايت مي‌بايد يك متخصص گزارش تهيه شده به وسيله نرم‌افزار را قرائت كند و درباره آن تصميم بگيرد. اما مزيت اين نرم‌افزار آنست كه به كارشناسان اجازه مي‌دهد موضوعات را بر حسب درجه اهميتشان تنظيم كنند و به آنها اولويت بدهند.