انتشار "پژوهشنامه تبديل متن به گفتار" در قالب نسخه چاپي و الكترونيكي
ایتنا - زبان فارسي در حوزه ادبيات مقامي چندان رفيع دارد که کمتر زباني از نظر ارزشهاي هنر و معني با آن برابري ميکند، اما در حوزه علوم و فنون بايد براي بقا تلاش کند و مسيري دشوار را بپيمايد.
پژوهشنامه تبديل متن به گفتار" به عنوان نخستين گام براي دستيابي به ابزار تبديل اطلاعات موجود از قالب نوشتاري به قالب گفتاري منتشر و نسخه الكترونيكي آن در وبگاه SCICT.IR قرار گرفت.
به گزارش ایتنا از دبيرخانه شوراي عالي اطلاعرساني، زبان فارسي در حوزه ادبيات مقامي چندان رفيع دارد که کمتر زباني از نظر ارزشهاي هنر و معني با آن برابري ميکند، اما در حوزه علوم و فنون بايد براي بقا تلاش کند و مسيري دشوار را بپيمايد. در حوزه خط و زبان فارسي در محيط رايانهاي، دبيرخانه شوراي عالي اطلاعرساني موظف است دسترسي به اين زبان را در محيط رايانهاي آسانتر سازد و کاربرد و امکانات آن را در اين محيط افزایش دهد. با توجه به چنين نگرشي و مسائل مطرح مهم در حوزه خط و زبان فارسي در محيط رايانهاي، فراهم آوردن امکان تبديل متن به گفتار و بهينهسازي آن يکي از اولويتهاي مهم محسوب ميشود.
تبديل متن به گفتار، يکي از مهمترين ابزارهاي تبديل اطلاعات موجود از قالب نوشتاري به قالب گفتاري است. اين دبيرخانه به عنوان نخستين گام در تلاشي روشمند براي دستيابي به اين ابزار، با دعوت از جمعی از متخصصان و دستاندرکاران، کارگروهی را تشکیل داد تا با گردآوري منابع موجود، مباحث مرتبط با اين حوزه را از ديدگاههاي مختلف فني، اجتماعي، فرهنگي، کاربردي و مديريتي، مورد بررسي و تجزيه و تحليل قرار دهد؛ پژوهشنامه حاضر نتیجه این مراحل است.
تبديل متن به گفتار با دو قالب اساسي زبان يعني قالب نوشتاري و قالب گفتاري آن در ارتباط است. در قالب نوشتاري با پيچيدگيهاي فراوان در انواع تحليلهاي صرفي، نحوي، معنايي به منظور استخراج انواع اطلاعات مورد نياز از متن ورودي روبرو هستيم. بسياري از اين تحليلها در کاربردهاي ديگري چون ترجمه ماشيني، خلاصهسازي و طبقهبندي متون، سامانههاي پرسش و پاسخ، بازيابي اطلاعات، جستوجو در پايگاههاي داده متني و مانند آن نيز مورد نياز است. علاوه بر اين در تبديل متن به گفتار با قالب گفتاري زبان نيز سروکار داريم و بنابراين با هدف دستیابی به گفتاري نزديک به گفتار طبيعي، با مشکلات عديدهاي در توليد تلفظ و نواي مناسب براي گفتار بازسازي شده روبرو هستيم.
اين مشکلات همواره مورد توجه محققان در سراسر دنيا قرار داشته است و مقالات فراواني همه ساله در بسياري از نشستهاي علمي معتبر ارائه ميشود. با وجود پژوهشهاي فراوان و سرمايهگذاريهاي بسيار در اين زمينه، پيچيدگي ذاتي مسائل در اين حوزه و گستردگي علوم و فناوريهاي مرتبط با آن سبب شده است که راه زيادي تا تولید محصولات ایدهآل تبديل متن به گفتار باقي باشد.
آنچه در اين پژوهشنامه بدان پرداخته شده است شامل ارائه تعريف تبديل متن به گفتار، کاربرد و کاربران عمده آن، اهميت، آثار و فوائد علمي، اجتماعي، فرهنگي و اقتصادي حاصل از بهکارگیری آن، تاريخچه، ويژگيها و قابليتهاي يک سامانه تبديل متن به گفتار، مباحث علمي پايه مورد استفاده در تبديل متن به گفتار، زيرسيستمها و اجزاي يک سامانه تبديل متن به گفتار و پيشرفتهاي به دست آمده در ساخت هر يک از اين اجزاء در زبان فارسي و ساير زبانها و نيز استانداردها و روشهاي ارزيابي و محکزنی سامانههاي تبديل متن به گفتار، شناسايي منابع علمي، سازمانها، مراکز، مؤسسهها و پروژههاي مرتبط با تبديل متن به گفتار، ظرفيتهاي موجود و فعالان در جهان و ايران، مشکلات موجود براي فعاليت فعالان در ايران، نهادهاي حمايتکننده و نقش هر کدام در پيشبرد تبديل متن به گفتار، چشمانداز و راهبردهاي نيل به مقصود، ارائه شده است.
اميد است که مطالب اين پژوهشنامه بتواند راهگشای علاقهمندان، دانشجويان و فعالان مبحث تبديل متن به گفتار و نيز علاقهمندان به زمينههايي چون پردازش و بازشناسي گفتار، ترجمه ماشيني، غلطيابي، بازيابي اطلاعات، سامانههاي جستجو در وب و پايگاههاي داده متني، خلاصهسازي و طبقهبندي متون و مانند آن قرار گيرد و مسئولان را نسبت به ضرورت توجه به اين زمينهها و بذل توجه و ارائه حمایتهای مادي و معنوي از آنها ترغيب نمايد.
همچنين لازم به ذکر است که اين پژوهشنامه ميتواند به عنوان مرجع مناسبي براي دروس دانشگاهي اعم از تبديل متن به گفتار، پردازش سيگنال صحبت (گفتار پردازي رقمي)، بازشناسي گفتار، پردازش زبان طبيعي، زبانشناسی رايانهاي و مانند آن مورد استفاده دانشجويان تحصيلات تکميلي در رشتههاي مهندسي کامپيوتر، مهندسي برق، مهندسي پزشکي، فيزيک، زبانشناسی و مانند آن قرار گيرد.
گفتني است پيش از اين، پژوهشنامه نويسهخوان نوري (OCR) در قالب نسخه چاپي و الكترونيكي و همچنين پژوهشنامه بازشناسي خودكار گفتار (ASR) و پژوهشنامه فونت در قالب نسخه الكترونيكي توسط اين دبيرخانه و از طريق وبگاه SCICT.IR منتشر شده بود.