Transformer-based modelling for sentiment analysis of coffee review
| dc.contributor.advisor | Taweesak Samanchuen | |
| dc.contributor.advisor | Prush Sangangam | |
| dc.contributor.author | Atiphan Charoenphon | |
| dc.date.accessioned | 2026-02-26T06:32:06Z | |
| dc.date.available | 2026-02-26T06:32:06Z | |
| dc.date.copyright | 2023 | |
| dc.date.created | 2026 | |
| dc.date.issued | 2023 | |
| dc.description.abstract | The development of social networks contributes to the growth of online content that becomes more relevant to the business. Customer reviews, feedback, and comments have been found mentioned online. Thus, sentiment analysis becomes a tool for businesses to extract insightful information from big data regarding customers’ needs and perceptions towards brands. In this study, the researcher aimed to set the experiments using an open dataset (Yelp Coffee Review) from kaggle.com as a case study. The natural language processing model was implemented by applying the Transformer-based models: BERT, ALBERT and RoBERTa, with six different classifications, including Logistic Regression, Naive Bayes, Decision Tree, Random Forest, Support Vector Machine, and K-Nearest Neighbors, to compare the performance, where imbalance data and hyperparameters have been considered in this study. In the experimental result, the research found that the RoBERTa model with Random Forest classifier performs best at 98.84% accuracy, while all the Transformer-based models outperform the conventional models as expected. Therefore, the models have proved their efficiency and advantage in shedding light on the customer sentiment analysis tool for business. Implication of the thematic paper: The findings of the study indicate that Transformer-based models offer businesses significant advantages and efficiencies for sentiment analysis by accurately analyzing customer sentiment data. The insightful data could support businesses in terms of decision-making, improving customer experiences, and optimizing marketing strategies. | en |
| dc.description.abstract | การพัฒนาการของโซเชียลเน็ตเวิร์กมีส่วนทำให้คอนเทนต์ออนไลน์มีความเกี่ยวข้องกับธุรกิจมากขึ้น คำวิจารณ์ คำติชม และความคิดเห็นของลูกค้าถูกค้นพบจำนวนมากบนโลกออนไลน์ ดังนั้น การวิเคราะห์ความรู้สึกจึงกลายเป็นเครื่องมือสำหรับธุรกิจในการวิเคราะห์ข้อมูลเชิงลึกจากข้อมูลขนาดใหญ่เกี่ยวกับความต้องการและการรับรู้ของลูกค้าที่มีต่อแบรนด์ ในการศึกษานี้ ผู้วิจัยมีวัตถุประสงค์เพื่อทำการทดลองโดยใช้ชุดข้อมูลแบบเปิด (Yelp Coffee Review) จากเว็บไซต์ kaggle.com เป็นกรณีศึกษาและใช้วิธีการประมวลผลภาษาธรรมชาติมาประยุกต์ใช้กับแบบจำลอง Transformer-based ทั้งสามชนิด ได้แก่ BERT, ALBERT และ RoBERTa โดยมี Classifications หกประเภทที่แตกต่างกัน ได้แก่ Logistic Regression, Naive Bayes, Decision Tree, Random Forest, Support Vector Machine และ K-Nearest Neighbors เพื่อเปรียบเทียบประสิทธิภาพ โดยเทคนิคการจัดการข้อมูลที่ไม่สมดุลและการเพิ่มประสิทธิภาพของ Hyperparameter จะถูกนำมาพิจารณาในการศึกษานี้ด้วย จากผลการทดลองพบว่า แบบจำลอง RoBERTa ทำงานได้ดีที่สุดที่ความแม่นยำ 98.84% ในขณะที่แบบจำลอง Transformer-based ทั้งสามแบบมีประสิทธิภาพดีกว่าแบบจำลองทั่วไปตามที่คาดไว้ ดังนั้น การศึกษาแบบจำลองนี้ได้พิสูจน์ให้เห็นถึงประสิทธิภาพและประโยชน์ต่อธุรกิจเกี่ยวกับเครื่องมือวิเคราะห์ความรู้สึกของลูกค้าการนำผลของสารนิพนธ์ไปใช้:ผลการวิจัยระบุว่า แบบจำลอง Transformer ทั้งสามแบบที่นำมาใช้ในการทดลอง มีประโยชน์ที่สำคัญต่อมุมมองธุรกิจ สำหรับการวิเคราะห์ความพึงพอใจโดยการวิเคราะห์ข้อมูลความคิดเห็นของลูกค้าอย่างแม่นยำ ข้อมูลเชิงลึกนี้สามารถสนับสนุนธุรกิจในแง่ของการตัดสินใจ ปรับปรุงประสบการณ์ของลูกค้า และพัฒนาแผนกลยุทธ์ทางการตลาดให้เหมาะสม | tha |
| dc.format.extent | xiii, 130 leaves : ill. | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.citation | Thematic Paper (M.Sc. (Information Technology Management))--Mahidol University, 2023 | |
| dc.identifier.uri | https://repository.li.mahidol.ac.th/handle/123456789/115303 | |
| dc.language.iso | eng | |
| dc.publisher | Mahidol University | |
| dc.rights | ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า | |
| dc.rights.holder | Mahidol University | |
| dc.subject | Sentiment analysis -- Data processing. | |
| dc.subject | Natural language processing (Computer science) | |
| dc.subject | Customer relations -- Data processing. | |
| dc.subject | Machine learning -- Research. | |
| dc.subject | Business planning -- Data processing. | |
| dc.subject | M.Sc. (2023) | |
| dc.subject | Information Technology Management (Mahidol University 2023) | |
| dc.title | Transformer-based modelling for sentiment analysis of coffee review | |
| dc.title.alternative | การสร้างโมเดลวิเคราะห์ความรู้สึกของรีวิวกาแฟจากแบบจำลอง Transformer | |
| dc.type | Master Thesis | |
| dcterms.accessRights | open access | |
| thesis.degree.department | Faculty of Engineering | |
| thesis.degree.discipline | Information Technology Management | |
| thesis.degree.grantor | Mahidol University | |
| thesis.degree.level | Master's degree | |
| thesis.degree.name | Master of Science |
Files
Original bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- TH_Atiphan_C_2023.pdf
- Size:
- 7.67 MB
- Format:
- Adobe Portable Document Format
