2012 ©
             ข้อมูลการเผยแพร่ผลงาน
การเผยแพร่ในรูปของบทความวารสารทางวิชาการ
ชื่อบทความ Data Regions Extraction for Semi-Structured Web Pages Using Bottom-up Approach 
วัน/เดือน/ปี ที่ได้ตอบรับ 26 ธันวาคม 2557 
วารสาร
     ชื่อวารสาร KKU RESEARCH JOURNAL (GRADUATE STUDIES) 
     มาตรฐานของวารสาร TCI 
     หน่วยงานเจ้าของวารสาร Graduate School, Khon Kaen University 
     ISBN/ISSN 1906-201X 
     ปีที่ 14 
     ฉบับที่
     เดือน December
     ปี พ.ศ. ที่พิมพ์ 2557 
     หน้า 1-16 
     บทคัดย่อ In this paper, we propose an unsupervised information extraction system called Bottom-up Wrapper (BUW) for automatic extracting the data regions from the semi-structured web pages such as search result pages, product catalog pages, etc. Although, data records in a semi-structured web page are generated from backend databases and encoded into the HTML with fixed templates from server-side scripts, but these data records are represented without the structural information. Moreover, the complexity of the website is increasing, that make it difficult to automatically identify the correct data region and extract the relevant data records. While, many existing techniques use a top-down approach that starts to identify the data regions before the data records and data items. In another way, we figured out the stated problem in a bottom-up way that starts to analyze the repetitive patterns of data items, which can be used for identifying the relevant data records and data regions. This technique is completely unsupervised and maintenance-free wrapper. For performance evaluation purpose, it is empirically tested on the real world websites. Consequently, it provides the outstanding result that the proposed technique is robust and in many cases outperforms existing wrappers such as RSP and SDE (based onDEPTA).  
     คำสำคัญ Information extraction(การสกัดสารสนเทศ);Bottom-up approach(กระบวนการแบบล่างขึ้นบน);Semi-structured web pages(หน้าเว็บแบบกึ่งโครงสร้าง) 
ผู้เขียน
537020029-1 นาย วชิราวุธ ธรรมวิเศษ [ผู้เขียนหลัก]
คณะวิทยาศาสตร์ ปริญญาเอก ภาษาอังกฤษ

การประเมินบทความ มีผู้ประเมินอิสระ 
สถานภาพการเผยแพร่ ตีพิมพ์แล้ว 
วารสารมีการเผยแพร่ในระดับ ชาติ 
citation มี 
เป็นส่วนหนึ่งของวิทยานิพนธ์ เป็น 
แนบไฟล์
Citation 0