زبانشناسی رایانهای
عطیه کامیابی گل؛ الهام اخلاقی باقوجری؛ هانیه حبیبی
دوره 12، شماره 2 ، دی 1399، ، صفحه 227-246
چکیده
پیکره شامل متنهای پیوسته طبیعی است که به صورت الکترونیکی ارائه شدهاست و میتوان از آن اطلاعات درباره عناصر زبانی، بهصورت واژگانی و غیرواژگانی در کمترین زمان ممکن و با بالاترین میزان دقت، استخراج نمود. نویسندگان این مقاله، پیکره زبانی آکادمیک فردوسی را ایجاد کرده و هدف از این مقاله معرفی پیکره اعضای هیات علمی دانشگاه فردوسی ...
بیشتر
پیکره شامل متنهای پیوسته طبیعی است که به صورت الکترونیکی ارائه شدهاست و میتوان از آن اطلاعات درباره عناصر زبانی، بهصورت واژگانی و غیرواژگانی در کمترین زمان ممکن و با بالاترین میزان دقت، استخراج نمود. نویسندگان این مقاله، پیکره زبانی آکادمیک فردوسی را ایجاد کرده و هدف از این مقاله معرفی پیکره اعضای هیات علمی دانشگاه فردوسی مشهد و بهکارگیری آن در تحلیل و توصیف عبارات احتیاطآ میز در دو حوزه علومانسانی و علومپایه است. عبارات احتیاطآمیز میزان قطعیت کلام نویسنده را با کلماتی مانند «شاید»، «ممکن است» و «حتما» مشخص میکند. پژوهشهایی که تاکنون بر روی این عبارات انجام شدهاست، با دادههایی اندک و به صورت کاملا دستی انجامشدهاند. در این پژوهش ضمن استفاده از دستهبندی سلاجرمیر (1997) برای شناسایی عبارات احتیاطآمیز، دادهها با استفاده از پیکره الکترونیکی ساختهشده که شامل 1100 مقاله زبان فارسی میباشد، استخراج شدند. بر اساس نتایج حاصل از این پژوهش میزان کاربرد عبارات احتیاطآمیز در حوزه علومانسانی حدود دو برابر بیشتر از حوزه علومپایه بود. در این میان استفاده از شرطیها و عبارات حاکی از شک و تردید در هر دو حوزه بسامد بالایی داشتند. نتایج حاصل از این پژوهش به علت بالاتر بودن حجم دادههای مورد استفاده نسبت به تحقیقات پیشین، قابلیت تعمیم بیشتری به عنوان الگو در نوشتن مقالات علمی زبان فارسی را دارا هستند. همچنین تأیید شد پیکره ساختهشده در این پژوهش که تا 96 درصد دقت دارد، به عنوان منبع بسیار خوبی برای تحلیل و تحقیق بر روی متون علمی قابل استفاده است.