نوع مقاله : مقاله پژوهشی
نویسنده
دانشگاه اصفهان
چکیده
پژوهش حاضر به بررسی آکوستیکی پارامترهای کیفیت صدا در دو گروه زنان و مردان فارسیزبان میپردازد. این مطالعه با هدف ارزیابی توانایی پارامترهای کیفیت صدا در تمایز گویندگان فارسیزبان و بررسی میزان اثرگذاری این پارامترها در شناسایی ویژگیهای گویندهمحور طراحی شده است. علاوه بر این، این پژوهش با هدف گسترش دانش موجود در حوزة کیفیت صدا و پر کردن خلأ مطالعات محدود پیشین در زبان فارسی انجام شده است. دادههای آوایی از ۲۰ گویشور زن و ۲۰ گویشور مرد در محیط آزمایشگاهی ضبط شدند. برای تحلیل تفاوتهای میان گویندگان از آزمون تحلیل واریانس چندمتغیره و برای ارزیابی اهمیت ویژگیها، از الگوریتم جنگل تصادفی بهره گرفته شد. شش پارامتر کیفیت صدا شامل فرکانسپریشی، دامنهپریشی، نسبت هارمونیک به نویز، نسبت دامنة هارمونیکهای اول و دوم، برجستگی قلة طیفی و فرکانس پایه انتخاب شدند. نتایج نشان داد که ویژگیهای کیفیت صدا در نشاندادن تفاوتهای آکوستیکی میان گویندگان فارسیزبان دارای تفاوتهای معناداری بودهاند، اگرچه توانایی آنها در تمایز گویندگان بهطور یکسان نبوده است. برای گویندگان مرد، پارامترهای برجستگی قلة طیفی، نسبت هارمونیک به نویز و نسبت دامنة هارمونیکهای اول و دوم، به ترتیب بیشترین توانایی را در تمایز آنها از یکدیگر دارند. برای گویندگان زن، فرکانس پایه، برجستگی قلة طیفی و نسبت هارمونیک به نویز بهعنوان مهمترین ویژگیها برای تشخیص هویت شناخته شدند. نتایج این پژوهش نشان میدهد که پارامترهای کیفیت صدا نقش قابلتوجهی در شناسایی گویندگان فارسیزبان دارند. با این حال، برای دستیابی به دقت بالاتر در سیستمهای شناسایی گوینده، توجه به تفاوتهای جنسیتی و اهمیت متغیرهای مختلف ضروری است. از طرف دیگر، محدودیت تعداد شرکت کنندگان ممکن است بر تعمیم پذیری نتایج تأثیر بگذارد. بنابراین، پیشنهاد میشود در پژوهشهای آینده، از نمونههای بزرگتر و تنوع بیشتر در گویندگان استفاده شود.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Analysis of Acoustic Voice Quality Parameters for Identifying Persian Speakers
نویسنده [English]
- Homa Asadi
Azadi Square, University of Isfahan
چکیده [English]
This study acoustically examines voice quality parameters in two groups of Persian-speaking men and women. The study aims to assess the ability of voice quality parameters to differentiate Persian speakers and to evaluate the extent to which these parameters capture speaker-specific information. Additionally, this research seeks to expand existing knowledge in the field of voice quality and address the limited scope of previous studies on Persian. Acoustic data were collected from 20 female and 20 male speakers in a laboratory setting. Multivariate analysis of variance (MANOVA) was used to analyze inter-speaker differences, and the Random Forest algorithm was employed to assess feature importance. Six voice quality parameters were selected for analysis: jitter (frequency perturbation), shimmer (amplitude perturbation), harmonic-to-noise ratio (HNR), the ratio of the amplitudes of the first and second harmonics (H1-H2), cepstral peak prominence (CPP), and fundamental frequency (F0). The results demonstrated significant acoustic differences among Persian speakers based on voice quality features, though the discriminative power of these features was not uniform. For male speakers, CPP, HNR, and H1-H2 were identified as the most discriminative features, respectively. For female speakers, F0, CPP, and HNR emerged as the key features for speaker identification. The findings highlight the significant role of voice quality parameters in identifying Persian speakers. However, achieving higher accuracy in speaker recognition systems requires considering gender differences and the relative importance of various variables. Moreover, the limited number of participants may affect the generalizability of the results. Thus, future studies are recommended to include larger and more diverse speaker samples.
کلیدواژهها [English]
- Acoustic phonetics
- speaker-specific information
- voice quality
- Persian speech
ارسال نظر در مورد این مقاله