پیکره بین المللی بنیاد سعدی

تعداد بازدید:۲۴۴

پیکره به مجموعه‌ای از داده‌های طبیعی زبان گفته می‌شود. پیکره زبان‌آموز مجموعه داده‌های زبانی تولیدشده توسط کسانی است که در حال یادگیری یک زبان هستند. به کمک پیکره‌های زبان‌آموز می‌توان روند یادگیری یک زبان را شناسایی کرد و برای آموزش بهتر آن زبان برنامه‌ریزی کرد. نرم‌افزار پیکره زبان‌آموز بنیاد سعدی، نرم‌افزاری است تحت وب برای ورود و مدیریت متون تولیدی فارسی‌آموزان. در این نرم‌افزار می‌توان متون فارسی‌آموزان را از سطح آوایی تا نحوی برچسب‌گذاری کرد و بر اساس پارامترهای مختلف در آن به جستجو پرداخت. تاکنون حدود 2700 متن (حدودا 435 هزار واژه) از فارسی‌آموزان بنیاد سعدی، کالج بین‌الملل دانشکده علوم پزشکی دانشگاه تهران و جامعه المصطفی در این نرم‌افزار وارد شده‌است.

پیکره زبان‌آموز بنیاد سعدی اکنون در حال توسعه است و به‌زودی مطابق با «دستور وابستگی جهانی» توسعه می‌یابد. دسترسی به این نرم‌افزار و داده‌های آن برای پژوهشگران از طریق مکاتبه با بنیاد سعدی امکان‌پذیر است.

ویژگی‌های اصلی:

۱تایپ متن زبان‌آموز به همراه فراداده‌ها (Metadata): نوع آزمون، موضوع متن، ملیت نویسنده، نمره، سطح نویسنده

۲افزودن فراداده‌های جدید

۳برچسب‌زنی متون در سطح حرف، واژه، جمله و عبارت

۴افزودن برچسب‌های جدید

۵جستجو و دیدن متن بر اساس نوع برچسب، سطح زبان‌آموز و نوع متن

۶  .تعریف سطح دسترسی عادی و مدیریتی

آخرین ویرایش۰۱ بهمن ۱۳۹۸