پیکره بین المللی بنیاد سعدی

تعداد بازدید:۱۲۴۶

پیکره به مجموعه‌ای از داده‌های طبیعی زبان گفته می‌شود. پیکره زبان‌آموز مجموعه داده‌های زبانی تولیدشده توسط کسانی است که در حال یادگیری یک زبان هستند. به کمک پیکره‌های زبان‌آموز می‌توان روند یادگیری یک زبان را شناسایی کرد و برای آموزش بهتر آن زبان برنامه‌ریزی کرد. نرم‌افزار پیکره زبان‌آموز بنیاد سعدی، نرم‌افزاری است تحت وب برای ورود و مدیریت متون تولیدی فارسی‌آموزان. در این نرم‌افزار می‌توان متون فارسی‌آموزان را از سطح آوایی تا نحوی برچسب‌گذاری کرد و بر اساس پارامترهای مختلف در آن به جستجو پرداخت. تاکنون حدود ۲۷۰۰ متن (حدوداً ۴۳۵ هزار واژه) از فارسی‌آموزان بنیاد سعدی، کالج بین‌الملل دانشکده علوم پزشکی دانشگاه تهران و جامعه المصطفی در این نرم‌افزار وارد شده‌است.

پیکره زبان‌آموز بنیاد سعدی اکنون در حال توسعه است و به‌زودی مطابق با «دستور وابستگی جهانی» توسعه می‌یابد. دسترسی به این نرم‌افزار و داده‌های آن برای پژوهشگران از طریق مکاتبه با بنیاد سعدی امکان‌پذیر است.

ویژگی‌های اصلی:

۱. تایپ متن زبان‌آموز به همراه فراداده‌ها ( Metadata ): نوع آزمون، موضوع متن، ملیت نویسنده، نمره، سطح نویسنده

۲. افزودن فراداده‌های جدید

۳. برچسب‌زنی متون در سطح حرف، واژه، جمله و عبارت

۴. افزودن برچسب‌های جدید

۵. جستجو و دیدن متن بر اساس نوع برچسب، سطح زبان‌آموز و نوع متن

۶ .تعریف سطح دسترسی عادی و مدیریتی

آخرین ویرایش۲۹ اردیبهشت ۱۴۰۰