| ชื่อบทความที่เผยแพร่ |
Semi-Automatic Word-Aligned Tool for Thai-Vietnamese Parallel Corpus Construction |
| วัน/เดือน/ปี ที่เผยแพร่ |
14 ตุลาคม 2562 |
| การประชุม |
| ชื่อการประชุม |
16th International Joint Conference on Computer Science and Software Engineering (JCSSE 2019) |
| หน่วยงาน/องค์กรที่จัดประชุม |
Faculty of Informatics, Burapha University, Chonburi, Thailand |
| สถานที่จัดประชุม |
Amari Pattaya |
| จังหวัด/รัฐ |
ชลบุรี |
| ช่วงวันที่จัดประชุม |
10 กรกฎาคม 2562 |
| ถึง |
12 กรกฎาคม 2562 |
| Proceeding Paper |
| Volume (ปีที่) |
2019 |
| Issue (เล่มที่) |
1 |
| หน้าที่พิมพ์ |
121-125 |
| Editors/edition/publisher |
|
| บทคัดย่อ |
A corpus, especially a parallel corpus, which contains both source and target language, is an important resource in Natural Language Processing (NLP) research, particularly in machine translation. A quality corpus can improve the accuracy of the translation results significantly; however, corpus construction is very time consuming, and requires the expertise of linguistic experts. In this paper, we present Thai-Vietnamese parallel corpus construction and the process of building a Thai-Vietnamese parallel corpus. This work focuses on the construction of a semi-automatic word-alignment tool, capable of assisting researchers in the construction of a parallel corpus. The collection and validation within this study was achieved through the use of our development tool. In the first stage, the Vietnamese -Thai parallel corpus, containing 14,771 sentence pairs; was collected, aligned at word level, and validated by linguistic experts. This parallel corpus can be used as a reliable resource for statistical machine translation and other applications. |
| ผู้เขียน |
|
| การประเมินบทความ (Peer Review) |
มีผู้ประเมินอิสระ |
| มีการเผยแพร่ในระดับ |
นานาชาติ |
| รูปแบบ Proceeding |
Full paper |
| รูปแบบการนำเสนอ |
Oral |
| เป็นส่วนหนึ่งของวิทยานิพนธ์ |
เป็น |
| ใช้สำหรับสำเร็จการศึกษา |
ไม่เป็น |
| ผลงานที่นำเสนอได้รับรางวัล |
ไม่ได้รับรางวัล |
| แนบไฟล์ |
|
| Citation |
0
|
|
|