ایتنا -در میان چهار میلیارد صفحه فارسی شناساییشده توسط جستوجوگر پارسیجو، نزدیک به ۲۵ درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم است.
معاون محتوای مرکز ملی فضای مجازی کشور با بیان اینکه در سال ۲۰۱۷، زبان فارسی به یازدهمین زبان پرکاربرد در وب رسیده، گفت: این رشد در حالی است که زبان فارسی در حال حاضر یک رتبه بالاتر از زبان ترکی و پنج رتبه بالاتر از زبان عربی قرار دارد و محبوبترین زبان منطقه غرب آسیا و خاورمیانه در شبکه جهانی وب محسوب میشود.
به گزارش ایتنا از ایسنا، امیر خوراکیان درباره اهمیت توجه به تولید محتوای باکیفیت به زبان فارسی در وب اظهار کرد: در میان چهار میلیارد صفحه فارسی شناساییشده توسط جستوجوگر پارسیجو، نزدیک به ۲۵ درصد آن، ارزشمند بوده و بقیه صفحات تکراری یا اسپم است و این موضوع نشان میدهد کیفیت تولید محتوا به زبان فارسی در فضای مجازی در حد مطلوب نیست.
۵۰ درصد وب در دست زبان انگلیسی
وی با بیان اینکه سهم زبان انگلیسی در وب بیش از هر زبان دیگری است، تاکید کرد: زبان انگلیسی به تنهایی ۵۱.۲ درصد از محتوای وب را در اختیار دارد ولی این سهم در سال ۲۰۱۱، ۵۷ درصد بوده و این کاهش نشاندهنده این است که کشورها برای گسترش زبان خود در فضای مجازی در تلاش هستند.
معاون محتوای مرکز ملی فضای مجازی، اظهار کرد: سهم زبان عربی در سالهای اخیر کاهش یافته است. از طرفی رشد زبان روسی بیش از هر زبان دیگری چشمگیر است تا جایی که توانسته برتری قابل توجهی نسبت به سایر زبانهای قدرتمند همچون آلمانی و فرانسوی به دست آورد.
خوراکیان اعلام کرد: در رشد زبان عربی در فضای مجازی، آمریکا نقش بسزایی داشته و تولید وردنت عربی که منبع زبانی لازم و زیرساخت پردازش خط و زبان عربی است، با سرمایه گذاری آژانس اطلاعات مرکزی آمریکا (CIA) انجام شده است. این در حالی است که شرکت DARPA وابسته به وزارت دفاع آمریکا روی پردازش چهار زبان دنیا که یکی از آنها فارسی است، با اهداف جاسوسی سرمایهگذاری کرده و قابل توجه اینکه تنها منبع زبانی با دقت بسیار خوب در زمینه پردازش زبان استعارهای فارسی توسط این شرکت تولید شده است.
سهم کشور از بازار حوزه پردازش ناچیز است
معاون محتوای مرکز ملی فضای مجازی با بیان اینکه سهم ایران از بازار ۳۴۰ میلیارد دلاری حوزه پردازش خط و زبان بسیار ناچیز است، تصریح کرد: تعداد محدودی شرکت نسبتاً موفق در این حوزه داریم و علاوه بر آن وضعیت محصولات بومی حوزه پردازش خط و زبان فارسی مطلوب نیست، بنابراین باید در این حوزه تلاش بیشتری صورت گیرد.
وی با اشاره به اینکه فناوریهای جدید مثل دادههای بزرگ و اینترنت اشیا بدون پردازش خط و زبان نمیتوانند کار کنند، افزود: شناخت علایق، تفکر و پیشبینی الگوهای جامعه نیاز به پردازش محتوای تولیدشده توسط کاربران در فضای مجازی دارد و برای تولید محتوا نیاز به پردازش خط و زبان است.
معاون محتوای مرکز ملی فضای مجازی ادامه داد: نکته بسیار مهمی که در آینده محتوا وجود دارد این است که در آینده نزدیک، تولید محتواها توسط ماشینها انجام خواهد شد و از طریق محتواهای ماشینی مثل کامنتها و پستها، تفکر و نگرشها مهندسی میشود و برای تولید محتوا توسط ماشینها دسترسی به ابزارهای پردازشی خط و زبان ضرورت دارد.
هجمه به زبان فارسی توسط شبکههای معاند
خوراکیان در رابطه با هجمه رسانههای معاند به خط و زبان فارسی گفت: بیشترین هجمهها مربوط به شبکههای معاند ماهوارهای است که مشکلات پردازش زبان فارسی را به علت ضعف ذاتی خط فارسی بیان میکند و به تمسخر واژههای تولیدشده در فرآیند واژهگزینی فرهنگستان و تاکید بر استفاده از زبان مادری، با توجه به تنوع قوم و زبان در ایران در آموزشهای رسمی و تغییر خط فارسی به خط لاتین تاکید دارند.
وی افزود: تمایل نداشتن محققان و دانشگاهیان به انتشار نتایج تحقیقات خود به زبان فارسی در فضای مجازی، کمبود نشریات معتبر علمی الکترونیکی به زبان فارسی، نبود ساماندهی مناسب بانکهای اطلاعاتی علمی - پژوهشی فارسی، کمتوجهی به امکانات و قابلیتهای فضای مجازی در جهت ارتقای مهارتهای زبانی و ادبی عموم جامعه و همچنین استفاده نامناسب از فرصتها و قابلیتهای ویژه فضای مجازی بهمنظور گسترش و آموزش مجازی خط و زبان فارسی به غیرفارسیزبانان و کودکان ایرانی خارج از کشور، کمتوجهی به استفاده از ظرفیتهای بینالمللی و نبود روالهای رصد تحلیلی و آیندهپژوهی در خصوص وضعیت خط و زبان فارسی در فضای مجازی باعث شده تا حفظ و توسعه زبان فارسی در فضای مجازی با رشد مناسبی همراه نباشد.
معاون محتوای مرکز ملی فضای مجازی کشور با بیان اینکه سند ملی خط و زبان فارسی در فضای مجازی در کمیسیون ارتقای تولید محتوای فضای مجازی تصویب شده و در صف تصویب در صحن شورای عالی فضای مجازی کشور است، اعلام کرد: بهرهمندی از فرصتهای این فضا و جلوگیری از تهدیدهای آن برای خط و زبان فارسی نیاز به عزم ملی دارد، بنابراین مرکز ملی فضای مجازی کشور زمینهسازی برای ایجاد نهضت ملی، تولید و ارتقای محتوا، ضابطهگذاری و حمایت از آن و همچنین توسعه زیرساختهای فنی و انسانی را در دستور کار قرار داده که بتوانیم از خط و زبان فارسی در فضای مجازی به عنوان میراث و سرمایه مشترک همه ایرانیان حفاظت کنیم.
خوراکیان تاکید کرد: موازنه کمی و کیفی محتوای فارسی در این فضا باید به نفع تفکر و فرهنگ اصیل ایرانی – اسلامی تغییر کند، بنابراین نیاز است تا ضوابط و قواعد کاربرد فارسی معیار در فعالیت رسانههای رسمی، دستگاههای حاکمیتی و شخصیتهای حقوقی در فضای مجازی حاکم شود. همچنین پویاسازی و تجهیز خط و زبان فارسی مبتنی بر نیازمندیهای روزآمد حاکم بر فضای مجازی و تسهیل آموزش و فراگیری آن در سطوح ملی و بینالمللی میتواند در ارتقای آن در فضای مجازی مؤثر باشد.
وی با اشاره به اینکه برای توسعه خط و زبان فارسی در فضای مجازی میتوانیم پیوندهای راهبردی و همکاریهای بینالمللی به ویژه با کشورهای فارسی زبان داشته باشیم، افزود: برای صیانت و حفاظت از خط و زبان فارسی در فضای مجازی باید از ظرفیتهای تمامی فارسیزبانان در سراسر دنیا استفاده شود.