ชื่อบทความที่เผยแพร่ |
Semi-Automatic Word-Aligned Tool for Thai-Vietnamese Parallel Corpus Construction |
วัน/เดือน/ปี ที่เผยแพร่ |
14 ตุลาคม 2562 |
การประชุม |
ชื่อการประชุม |
16th International Joint Conference on Computer Science and Software Engineering (JCSSE 2019) |
หน่วยงาน/องค์กรที่จัดประชุม |
Faculty of Informatics, Burapha University, Chonburi, Thailand |
สถานที่จัดประชุม |
Amari Pattaya |
จังหวัด/รัฐ |
ชลบุรี |
ช่วงวันที่จัดประชุม |
10 กรกฎาคม 2562 |
ถึง |
12 กรกฎาคม 2562 |
Proceeding Paper |
Volume (ปีที่) |
2019 |
Issue (เล่มที่) |
1 |
หน้าที่พิมพ์ |
121-125 |
Editors/edition/publisher |
|
บทคัดย่อ |
A corpus, especially a parallel corpus, which contains both source and target language, is an important resource in Natural Language Processing (NLP) research, particularly in machine translation. A quality corpus can improve the accuracy of the translation results significantly; however, corpus construction is very time consuming, and requires the expertise of linguistic experts. In this paper, we present Thai-Vietnamese parallel corpus construction and the process of building a Thai-Vietnamese parallel corpus. This work focuses on the construction of a semi-automatic word-alignment tool, capable of assisting researchers in the construction of a parallel corpus. The collection and validation within this study was achieved through the use of our development tool. In the first stage, the Vietnamese -Thai parallel corpus, containing 14,771 sentence pairs; was collected, aligned at word level, and validated by linguistic experts. This parallel corpus can be used as a reliable resource for statistical machine translation and other applications. |
ผู้เขียน |
|
การประเมินบทความ (Peer Review) |
มีผู้ประเมินอิสระ |
มีการเผยแพร่ในระดับ |
นานาชาติ |
รูปแบบ Proceeding |
Full paper |
รูปแบบการนำเสนอ |
Oral |
เป็นส่วนหนึ่งของวิทยานิพนธ์ |
เป็น |
ผลงานที่นำเสนอได้รับรางวัล |
ไม่ได้รับรางวัล |
แนบไฟล์ |
|
Citation |
0
|
|