|
ข้อมูลการเผยแพร่ผลงาน
|
ชื่อบทความ |
Pitch segmentation of speech signals based on short-time energy waveform |
วัน/เดือน/ปี ที่ได้ตอบรับ |
12 กันยายน 2560 |
วารสาร |
ชื่อวารสาร |
International Journal of Speech Technology |
มาตรฐานของวารสาร |
SCOPUS |
หน่วยงานเจ้าของวารสาร |
springer |
ISBN/ISSN |
ISSN 1381-2416 |
ปีที่ |
2017 |
ฉบับที่ |
20 |
เดือน |
September |
ปี พ.ศ. ที่พิมพ์ |
2561 |
หน้า |
907-917 |
บทคัดย่อ |
In general, speech is constituted of quasi-repetitive
patterns called pitches representing the speech fundamental
period and tonal information of the voice. Extraction
of pitch information that is crucial for many speech processing
techniques, usually faces a noise problem and interference
caused by high-order harmonic components. This
paper introduces a novel, noise-robust method for determining
speech fundamental frequency and pitch segmentation,
based on a short-time energy waveform (SEW), defined as
a moving average squared signal. When applying a moving
average filter with a window size closed to the fundamental
period, nearly repetitive patterns, with fewer ripples, synchronizing
with actual pitches can clearly be observed in
the SEW. The DC component in the SEW is removed using
morphological top-hat and bottom-hat transforms. The fundamental
frequency is determined as the frequency corresponding
to the largest peak of the power spectrum of the
DC-removed SEW. Finally, a time-domain window search
is then performed to locate local extrema associated with
pitches. Compared to traditional pitch detection techniques,
the proposed technique yields pitch segmentation results
with a higher rate of accuracy and greater noise robustness. |
คำสำคัญ |
Pitch detection, Pitch segmentation, Fundamental frequency, Speech signal, Voice signal, Short-time energy waveform |
ผู้เขียน |
|
การประเมินบทความ |
มีผู้ประเมินอิสระ |
สถานภาพการเผยแพร่ |
ตีพิมพ์แล้ว |
วารสารมีการเผยแพร่ในระดับ |
นานาชาติ |
citation |
ไม่มี |
เป็นส่วนหนึ่งของวิทยานิพนธ์ |
เป็น |
แนบไฟล์ |
|
Citation |
0
|
|
|
|
|
|
|