ชื่อบทความที่เผยแพร่ |
Supplement Products Data Extraction and Classification Using Web Mining |
วัน/เดือน/ปี ที่เผยแพร่ |
22 มีนาคม 2563 |
การประชุม |
ชื่อการประชุม |
International Conference on Computing and Information Technology |
หน่วยงาน/องค์กรที่จัดประชุม |
คณะเทคโนโลยีสารสนเทศและนวัตกรรมดิจิทัล มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ |
สถานที่จัดประชุม |
Dusit thani pattaya |
จังหวัด/รัฐ |
ชลบุรี |
ช่วงวันที่จัดประชุม |
14 พฤษภาคม 2563 |
ถึง |
15 พฤษภาคม 2563 |
Proceeding Paper |
Volume (ปีที่) |
2020 |
Issue (เล่มที่) |
1 |
หน้าที่พิมพ์ |
31-39 |
Editors/edition/publisher |
springer |
บทคัดย่อ |
Currently, many product sellers like to advertise their supplement products on web. However, there are some ads showing messages to deceive consumers. This work presents a system to extraction supplement products advertisement data from web and classifies the illegal ads that show misleading properties. Therefore, we proposed a method to automatic search and extract ads text from multiple websites using defined supplements keywords. Then, the extracted ads texts were preprocessed by word segmentation, stop words eliminate methods, and classified by the misleadingness words database that be prohibited by the Food and Drug Administration of Thailand. All illegal classified ads would be computed TF-IDF vectors and stored in an illegal reference database. However, some illegal ads avoided to use the prohibited words that they can be classified as legal. Therefore, they would be re-classified by measuring the similarity with all ads in the reference database. The experimental results show that the proposed system can detect forbidden ads with an accuracy of 0.775. |
ผู้เขียน |
|
การประเมินบทความ (Peer Review) |
มีผู้ประเมินอิสระ |
มีการเผยแพร่ในระดับ |
นานาชาติ |
รูปแบบ Proceeding |
Full paper |
รูปแบบการนำเสนอ |
Oral |
เป็นส่วนหนึ่งของวิทยานิพนธ์ |
เป็น |
ใช้สำหรับสำเร็จการศึกษา |
ไม่เป็น |
ผลงานที่นำเสนอได้รับรางวัล |
ไม่ได้รับรางวัล |
แนบไฟล์ |
|
Citation |
0
|
|