ایتنا - در میان ۴ میلیارد صفحه فارسی شناسایی شده نزدیک به ۱ میلیارد آن، یعنی چیزی در حدود ۲۵ درصد، ارزشمند است.
مدیر اجرایی یک جویشگر بومی:
۷۵ درصد صفحات وب فارسی بی ارزش هستند
12 دی 1395 ساعت 14:38
ایتنا - در میان ۴ میلیارد صفحه فارسی شناسایی شده نزدیک به ۱ میلیارد آن، یعنی چیزی در حدود ۲۵ درصد، ارزشمند است.
مدیر اجرایی یک موتور جستجوگر با بیان این که ۷۵ درصد صفحات وب فارسی بیارزش هستند گفت: در میان ۴ میلیارد صفحه فارسی شناسایی شده نزدیک به ۱ میلیارد آن، یعنی چیزی در حدود ۲۵ درصد، ارزشمند است.
به گزارش ایتنا از تسنیم، امیرعلی خیراندیش با اعلام این خبر افزود: این جویشگر به کمک نسخه جدید فنی خود، توانسته است به رکورد تحت پوشش قراردادن ۴ میلیارد صفحه وب فارسی برسد که در مقایسه با رقم ۲ میلیارد در مدت مشابه سال پیش، نشان از افزایش ۱۰۰ درصدی میزان پوشش نسخه جدید این جستجوگر است.
وی با اشاره به اینکه ۷۵ درصد صفحات وب فارسی بیارزش هستند افزود: در میان ۴ میلیارد صفحه فارسی شناسایی شده توسط این جستجوگر، نزدیک به ۱ میلیارد آن، یعنی چیزی در حدود ۲۵ درصد، ارزشمند بوده و بقیه صفحات تکراری یا اسپم بوده است که نشان از ضعف تولید محتوی در زبان فارسی دارد.
او پیشنهاد کرد: با توجه به روندهای جهانی در مسئله تولید محتوی، افراد جامعه در هر شغل یا حرفه ای که هستند، میتوانند باتوجه به دانستههای علمی و کاربردی خود، به تولید محتوی معتبر و موثق در راستای آگاهیرسانی تخصص خود اقدام کنند که البته این مبحث باعث توسعه کسبوکار آنها نیز خواهد شد.
خیراندیش با بیان اینکه حجم بالای صفحات بیارزش، دو چالش بزرگ را پیش روی پارسی جو در پوشش صفحات وب فارسی قرار داده است افزود: این جستجوگر ملی برای کشف صفحات وب مفید فارسی باید تعداد زیادی از صفحات را شناسایی کند در حالی که تنها ۲۵ درصد آنها قابل استفاده برای کاربران است که همین عامل علاوه بر اتلاف زمان، فشار زیادی بر سرورها وارد میکند، ضمن اینکه موتور جستجوی ما برای حفظ و ارتقای کیفیت خود، ملزم به ارتقای مداوم هوش مصنوعی خود در بخش خزش، نمایهسازی و رتبهبندی است.
مدیراجرایی این جویشگر بومی ادامه داد: بهکارگیری فناوریهای نوین، درک صحیح از زبان فارسی، تکنیکهای موثر در حذف صفحات تکراری و اسپم و رعایت تناسبهای فرهنگی از جمله ویژگیهای بیبدیل جستجوگر پارسی جو و تسلط آن در حوزه وب فارسی است.
وی در پایان افزود: استفاده بیش از ۱۵ سرویس متنوع برای ارتقاء کیفیت نتایج جستجو، پوشش ۴ میلیارد سند فارسی، قدرت پاسخگویی به میلیونها پرسوجو در روز ، استفاده از خزشگر هوشمند با پوشش میلیاردها سند از جمله ویژگیهای جستجوگر ملی پارسی جو است.
کد مطلب: 47293
آدرس مطلب: https://www.itna.ir/news/47293/۷۵-درصد-صفحات-فارسی-بی-ارزش-هستند