ชื่อบทความที่เผยแพร่ |
Isarn Dialect Word Segmentation using Bi-directional Gated Recurrent Unit with transfer learning approach |
วัน/เดือน/ปี ที่เผยแพร่ |
22 ธันวาคม 2565 |
การประชุม |
ชื่อการประชุม |
The International Computer Science and Engineering Conference 2022 (ICSEC) |
หน่วยงาน/องค์กรที่จัดประชุม |
IEEE Thailand Section, IEEE ComSoc Thailand Chapter, and ECTI Association Thailand |
สถานที่จัดประชุม |
Kasetsart University, Chalermphrakiat Sakon Nakhon Province Campus |
จังหวัด/รัฐ |
Sakon Nakhon |
ช่วงวันที่จัดประชุม |
21 ธันวาคม 2565 |
ถึง |
23 ธันวาคม 2565 |
Proceeding Paper |
Volume (ปีที่) |
- |
Issue (เล่มที่) |
- |
หน้าที่พิมพ์ |
156 |
Editors/edition/publisher |
IEEE Xplore |
บทคัดย่อ |
This paper presents an Isarn dialect word segmentation based on a recurrent neural network. In this study, the Isarn text written in Thai script is taken as input. We explored the effectiveness of the types of recurrent layers; recurrent neural networks (RNN), gated recurrent units (GRU), and long short-term memory (LSTM). The F1-scores of RNN, GRU, and LSTM are 95.36, 96.05, and 95.70, respectively. The experiment results showed that using GRU as the recurrent layer achieved the best performance. To deal with borrowed words from Thai, transfer learning was applied to improve the performance of the model by fine-tuning the pre-trained model given the limited size of the Isarn corpus. The model trained through the transfer learning approach outperformed the model trained from the Isarn dataset alone. |
ผู้เขียน |
|
การประเมินบทความ (Peer Review) |
มีผู้ประเมินอิสระ |
มีการเผยแพร่ในระดับ |
นานาชาติ |
รูปแบบ Proceeding |
Full paper |
รูปแบบการนำเสนอ |
Oral |
เป็นส่วนหนึ่งของวิทยานิพนธ์ |
เป็น |
ผลงานที่นำเสนอได้รับรางวัล |
ไม่ได้รับรางวัล |
แนบไฟล์ |
|
Citation |
0
|
|