نوع مقاله : مقاله پژوهشی
نویسنده
استادیار زبانشناسی، دانشگاه اصفهان، اصفهان، ایران.
چکیده
پژوهش حاضر به بررسی آکوستیکی پارامترهای کیفیت صدا در دو گروه زنان و مردان فارسیزبان میپردازد. این مطالعه با هدف ارزیابی توانایی پارامترهای کیفیت صدا در تمایز گویندگان فارسیزبان و بررسی میزان اثرگذاری این پارامترها در شناسایی ویژگیهای گویندهمحور طراحی شده است. علاوه بر این، با هدف گسترش دانش موجود در حوزۀ کیفیت صدا و پر کردن خلأ مطالعات محدود پیشین در زبان فارسی انجام شده است. دادههای آوایی از ۲۰ گویشور زن و ۲۰ گویشور مرد در محیط آزمایشگاهی ضبط شدند. برای تحلیل تفاوتهای میان گویندگان از آزمون تحلیل واریانس چندمتغیره و برای ارزیابی اهمیت ویژگیها، از الگوریتم جنگل تصادفی بهره گرفته شد. شش پارامتر کیفیت صدا شامل فرکانسپریشی، دامنهپریشی، نسبت هارمونیک به نویز، نسبت دامنۀ هارمونیکهای اول و دوم، برجستگی قلۀ طیفی و فرکانس پایه انتخاب شدند. نتایج نشان داد ویژگیهای کیفیت صدا در نشاندادن تفاوتهای آکوستیکی میان گویندگان فارسیزبان دارای تفاوتهای معناداری بودهاند، اگرچه توانایی آنها در تمایز گویندگان بهطور یکسان نبوده است. برای گویندگان مرد، پارامترهای برجستگی قلۀ طیفی، نسبت هارمونیک به نویز و نسبت دامنۀ هارمونیکهای اول و دوم، به ترتیب بیشترین توانایی را در تمایز آنها از یکدیگر دارند. برای گویندگان زن، فرکانس پایه، برجستگی قلۀ طیفی و نسبت هارمونیک به نویز بهعنوان مهمترین ویژگیها برای تشخیص هویت شناخته شدند. نتایج این پژوهش نشان میدهد پارامترهای کیفیت صدا نقش قابلتوجهی در شناسایی گویندگان فارسیزبان دارند. بااینحال، برای دستیابی به دقت بالاتر در سیستمهای شناسایی گوینده، توجه به تفاوتهای جنسیتی و اهمیت متغیرهای مختلف ضروری است. از طرف دیگر، محدودیت تعداد شرکتکنندگان ممکن است بر تعمیمپذیری نتایج تأثیر بگذارد؛ بنابراین، پیشنهاد میشود در پژوهشهای آینده، از نمونههای بزرگتر و تنوع بیشتر در گویندگان استفاده شود.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Analysis of Acoustic Voice Quality Parameters for Identifying Persian Speakers
نویسنده [English]
- Homa Asadi
Assistant Professor of Linguistics University of Isfahan, Isfahan, Iran.
چکیده [English]
This study acoustically examines voice quality parameters in two groups of Persian-speaking men and women. It aimed to assess the ability of voice quality parameters to differentiate Persian speakers and to evaluate the extent to which these parameters capture speaker-specific information. Additionally, this research sought to expand existing knowledge in the field of voice quality and address the limited scope of previous studies on Persian. Acoustic data were collected from 20 female and 20 male speakers in a laboratory setting. Multivariate Analysis of Variance (MANOVA) was used to analyze inter-speaker differences, and the Random Forest Algorithm was employed to assess feature importance. Six voice quality parameters were selected for analysis: jitter (frequency perturbation), shimmer (amplitude perturbation), harmonic-to-noise ratio (HNR), the ratio of the amplitudes of the first and second harmonics (H1-H2), cepstral peak prominence (CPP), and fundamental frequency (F0). The results demonstrated significant acoustic differences among Persian speakers based on voice quality features, though the discriminative power of these features was not uniform. For male speakers, CPP, HNR, and H1-H2 were identified as the most discriminative features, respectively. For female speakers, F0, CPP, and HNR emerged as the key features for speaker identification. The findings highlight the significant role of voice quality parameters in identifying Persian speakers. However, achieving higher accuracy in speaker recognition systems requires considering gender differences and the relative importance of various variables. Moreover, the limited number of participants may affect the generalizability of the results. Thus, future studies are recommended to include larger and more diverse speaker samples.
کلیدواژهها [English]
- Acoustic Phonetics
- Speaker-Specific Information
- Voice Quality
- Persian Speech
Authors retain the copyright and full publishing rights. This is an open access article distributed under Creative Commons Attribution 4.0 International License (CC BY 4.0).
ارسال نظر در مورد این مقاله