پیکره بین المللی بنیاد سعدی
پیکره به مجموعهای از دادههای طبیعی زبان گفته میشود. پیکره زبانآموز مجموعه دادههای زبانی تولیدشده توسط کسانی است که در حال یادگیری یک زبان هستند. به کمک پیکرههای زبانآموز میتوان روند یادگیری یک زبان را شناسایی کرد و برای آموزش بهتر آن زبان برنامهریزی کرد. نرمافزار پیکره زبانآموز بنیاد سعدی، نرمافزاری است تحت وب برای ورود و مدیریت متون تولیدی فارسیآموزان. در این نرمافزار میتوان متون فارسیآموزان را از سطح آوایی تا نحوی برچسبگذاری کرد و بر اساس پارامترهای مختلف در آن به جستجو پرداخت. تاکنون حدود ۲۷۰۰ متن (حدوداً ۴۳۵ هزار واژه) از فارسیآموزان بنیاد سعدی، کالج بینالملل دانشکده علوم پزشکی دانشگاه تهران و جامعه المصطفی در این نرمافزار وارد شدهاست.
پیکره زبانآموز بنیاد سعدی اکنون در حال توسعه است و بهزودی مطابق با «دستور وابستگی جهانی» توسعه مییابد. دسترسی به این نرمافزار و دادههای آن برای پژوهشگران از طریق مکاتبه با بنیاد سعدی امکانپذیر است.
ویژگیهای اصلی:
۱. تایپ متن زبانآموز به همراه فرادادهها ( Metadata ): نوع آزمون، موضوع متن، ملیت نویسنده، نمره، سطح نویسنده
۲. افزودن فرادادههای جدید
۳. برچسبزنی متون در سطح حرف، واژه، جمله و عبارت
۴. افزودن برچسبهای جدید
۵. جستجو و دیدن متن بر اساس نوع برچسب، سطح زبانآموز و نوع متن
۶ .تعریف سطح دسترسی عادی و مدیریتی