نوع مقاله : مقاله پژوهشی

نویسنده

دانشگاه اصفهان

چکیده

پژوهش حاضر به بررسی آکوستیکی پارامترهای کیفیت صدا در دو گروه زنان و مردان فارسی‌زبان می‌پردازد. این مطالعه با هدف ارزیابی توانایی پارامترهای کیفیت صدا در تمایز گویندگان فارسی‌زبان و بررسی میزان اثرگذاری این پارامترها در شناسایی ویژگی‌های گوینده‌محور طراحی شده است. علاوه بر این، این پژوهش با هدف گسترش دانش موجود در حوزة کیفیت صدا و پر کردن خلأ مطالعات محدود پیشین در زبان فارسی انجام شده است. داده‌های آوایی از ۲۰ گویشور زن و ۲۰ گویشور مرد در محیط آزمایشگاهی ضبط شدند. برای تحلیل تفاوت‌های میان گویندگان از آزمون تحلیل واریانس چندمتغیره و برای ارزیابی اهمیت ویژگی‌ها، از الگوریتم جنگل تصادفی بهره گرفته شد. شش پارامتر کیفیت صدا شامل فرکانس‌پریشی، دامنه‌پریشی، نسبت هارمونیک به نویز، نسبت دامنة هارمونیک‌های اول و دوم، برجستگی قلة طیفی و فرکانس پایه انتخاب شدند. نتایج نشان داد که ویژگی‌های کیفیت صدا در نشان‌دادن تفاوت‌های آکوستیکی میان گویندگان فارسی‌زبان دارای تفاوت‌های معناداری بوده‌اند، اگرچه توانایی آن‌ها در تمایز گویندگان به‌طور یکسان نبوده است. برای گویندگان مرد، پارامترهای برجستگی قلة طیفی، نسبت هارمونیک به نویز و نسبت دامنة هارمونیک‌های اول و دوم، به ترتیب بیشترین توانایی را در تمایز آن‌ها از یکدیگر دارند. برای گویندگان زن، فرکانس پایه، برجستگی قلة طیفی و نسبت هارمونیک به نویز به‌عنوان مهم‌ترین ویژگی‌ها برای تشخیص هویت شناخته شدند. نتایج این پژوهش نشان می‌دهد که پارامترهای کیفیت صدا نقش قابل‌توجهی در شناسایی گویندگان فارسی‌زبان دارند. با این حال، برای دستیابی به دقت بالاتر در سیستم‌های شناسایی گوینده، توجه به تفاوت‌های جنسیتی و اهمیت متغیرهای مختلف ضروری است. از طرف دیگر، محدودیت تعداد شرکت کنندگان ممکن است بر تعمیم پذیری نتایج تأثیر بگذارد. بنابراین، پیشنهاد می‌شود در پژوهش‌های آینده، از نمونه‌های بزرگتر و تنوع بیشتر در گویندگان استفاده شود.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Analysis of Acoustic Voice Quality Parameters for Identifying Persian Speakers

نویسنده [English]

  • Homa Asadi

Azadi Square, University of Isfahan

چکیده [English]

This study acoustically examines voice quality parameters in two groups of Persian-speaking men and women. The study aims to assess the ability of voice quality parameters to differentiate Persian speakers and to evaluate the extent to which these parameters capture speaker-specific information. Additionally, this research seeks to expand existing knowledge in the field of voice quality and address the limited scope of previous studies on Persian. Acoustic data were collected from 20 female and 20 male speakers in a laboratory setting. Multivariate analysis of variance (MANOVA) was used to analyze inter-speaker differences, and the Random Forest algorithm was employed to assess feature importance. Six voice quality parameters were selected for analysis: jitter (frequency perturbation), shimmer (amplitude perturbation), harmonic-to-noise ratio (HNR), the ratio of the amplitudes of the first and second harmonics (H1-H2), cepstral peak prominence (CPP), and fundamental frequency (F0). The results demonstrated significant acoustic differences among Persian speakers based on voice quality features, though the discriminative power of these features was not uniform. For male speakers, CPP, HNR, and H1-H2 were identified as the most discriminative features, respectively. For female speakers, F0, CPP, and HNR emerged as the key features for speaker identification. The findings highlight the significant role of voice quality parameters in identifying Persian speakers. However, achieving higher accuracy in speaker recognition systems requires considering gender differences and the relative importance of various variables. Moreover, the limited number of participants may affect the generalizability of the results. Thus, future studies are recommended to include larger and more diverse speaker samples.

کلیدواژه‌ها [English]

  • Acoustic phonetics
  • speaker-specific information
  • voice quality
  • Persian speech
CAPTCHA Image