پیکره بین المللی بنیاد سعدی

تعداد بازدید:۲۷۶۹

یکی از مهم‌ترین اموری که در زبان‌شناسی کاربردی به آن پرداخته می‌شود، آموزش زبان است. در حوزۀ آموزش زبان، تابه‌حال به جنبه‌های گوناگونی توجه شده و پژوهش‌های متعددی با محوریت آنها انجام شده‌است از جمله ویژگی‌های زبان‌آموز (مانند سن، ملیت و جنسیت)، شرایط زبان‌آموز (مانند انگیزه، نیاز و سن)، ویژگی‌های دوره (مانند تأکید بر دستور یا ارتباط)، عوامل شناختی و شخصیتی و جنبه‌های دیگر. یکی از روش‌های مهمی که مخصوصاً در سال‌های اخیر و با پیشرفت در حوزۀ فناوری بیش از پیش مورد‌اقبال قرار گرفته‌است، استفاده از پیکره است. به طور خلاصه، منظور از پیکره در اینجا آن چیزی است که زبان‌آموزان به صورت گفتار یا نوشتار تولید می‌کنند. به طور طبیعی، تولیدات زبان‌آموز مجموعه‌ای از ساختارها و واژه‌های درست و نادرست است که تمامی آنها در شناختن روند یادگیری زبان ارزشمند است. به دلیل اهمیت فوق‌العادۀ پیکره و جایگاه بی‌بدیل آن در کشف روند زبان‌آموزی، چندین دهه است که پیکره‌های زبان‌آموز متنوعی به همت گروه‌های پژوهشی پا به عرصۀ وجود گذاشته‌اند و هر کدام توانسته‌اند تا اندازه‌ای به شناسایی روند زبان‌آموزی کمک کنند.

در همین راستا، بنیاد سعدی از چند سال پیش اقدام به راه‌اندازی سامانۀ پیکرۀ فارسی‌آموز نمود. این پیکره که با نام "پیکرۀ بین‌المللی بنیاد سعدی" شناخته می‌شود، شامل متن‌های گفتاری و نوشتاری فارسی‌آموزانی از سرتاسر دنیاست و به طور پیوسته در حال گسترش است. مجموع متن‌های نوشتاری دراختیار بنیاد سعدی تاکنون حدود ۱۴۷۰۰ و تعداد متن‌های گفتاری بالغ بر ۶۰۰ است. از این میان، بالغ بر ۵۰۰۰ متن نوشتاری و ۲۳ متن‌های گفتاری در سامانه وارد شده‌است. بخش کوچکی از این متون برچسب‌گذاری شده و علاوه بر گسترش تعداد متن‌ها و افزایش حجم پیکره، در صدد هستیم در گام نخست، با برچسب‌زنی متن‌های موجود در سامانه بر اساس نظام برچسب‌زنی خطای بنیاد سعدی، به یکی از اهداف مطرح‌شده در کارگروه تخصصی پیکرۀ بنیاد سعدی، یعنی شناسایی زبان میانی فارسی‌آموزان، برسیم. چنین دستاوردی هم به کار برنامه‌ریزان آموزشی و نویسندگان منابع می‌آید و هم تشخیص سطح زبانی را تسهیل می‌کند. تمامی این امور در نهایت موجب مفیدترشدن آموزش‌ها و بالارفتن اعتبار سنجش‌ها می‌شود و بدین ترتیب به اعتلای زبان فارسی در سطح جهان کمک می‌کند.

تاکنون پژوهش‌هایی در خصوص تهیۀ پیکرۀ فارسی‌آموز و ملاحظات و امکانات آن انجام شده‌است که دو عدد از آنها از پیوند زیر قابل‌دسترسی است. با مراجعه به این دو پژوهش می‌توانید بیشتر با نحوۀ تهیه و برچسب‌زنی یک پیکرۀ فارسی‌آموز آشنا شوید.

صفری، سعید (۱۳۹۱). طراحی و ایجاد پیکرۀ تولیدی زبان‌آموز فارسی. پایان‌نامۀ کارشناسی ارشد رشتۀ آموزش زبان فارسی به غیر‌فارسی‌زبانان. تهران: دانشگاه علامه طباطبایی.

Safari, Saeed (2018). The Salam Farsi Learner Corpus – Introducing the Error Tagging System. Анали Филолошког факултета, ۳۰ (۲), ۲۴۹–۲۶۳. ‌‌‌‌‌

همچنین مراکز آموزش زبان فارسی می‌توانند تصاویر داده‌های نوشتاری یا فایل ضبط‌شدۀ داده‌های گفتاری فارسی‌آموزان خود را برای بهره‌برداری در جهت تقویت وضعیت آموزش زبان فارسی برای ما ارسال کنند. برای این منظور، مطالعۀ پیوندهای زیر لازم است. ضروری است هر مجموعه از داده‌ها به همراه کاربرگ فرادادۀ مربوط به آن مجموعه به این آدرس ایمیل ارسال شود:

corpus@saadifoundation.ir

پیوند ضوابط تهیۀ گفتار

پیوند ضوابط تهیۀ نوشتار

پیوند کاربرگ فراداده

آخرین ویرایش۰۷ اسفند ۱۴۰۱