Transformer-based modelling for sentiment analysis of coffee review

dc.contributor.advisorTaweesak Samanchuen
dc.contributor.advisorPrush Sangangam
dc.contributor.authorAtiphan Charoenphon
dc.date.accessioned2026-02-26T06:32:06Z
dc.date.available2026-02-26T06:32:06Z
dc.date.copyright2023
dc.date.created2026
dc.date.issued2023
dc.description.abstractThe development of social networks contributes to the growth of online content that becomes more relevant to the business. Customer reviews, feedback, and comments have been found mentioned online. Thus, sentiment analysis becomes a tool for businesses to extract insightful information from big data regarding customers’ needs and perceptions towards brands. In this study, the researcher aimed to set the experiments using an open dataset (Yelp Coffee Review) from kaggle.com as a case study. The natural language processing model was implemented by applying the Transformer-based models: BERT, ALBERT and RoBERTa, with six different classifications, including Logistic Regression, Naive Bayes, Decision Tree, Random Forest, Support Vector Machine, and K-Nearest Neighbors, to compare the performance, where imbalance data and hyperparameters have been considered in this study. In the experimental result, the research found that the RoBERTa model with Random Forest classifier performs best at 98.84% accuracy, while all the Transformer-based models outperform the conventional models as expected. Therefore, the models have proved their efficiency and advantage in shedding light on the customer sentiment analysis tool for business. Implication of the thematic paper: The findings of the study indicate that Transformer-based models offer businesses significant advantages and efficiencies for sentiment analysis by accurately analyzing customer sentiment data. The insightful data could support businesses in terms of decision-making, improving customer experiences, and optimizing marketing strategies.en
dc.description.abstractการพัฒนาการของโซเชียลเน็ตเวิร์กมีส่วนทำให้คอนเทนต์ออนไลน์มีความเกี่ยวข้องกับธุรกิจมากขึ้น คำวิจารณ์ คำติชม และความคิดเห็นของลูกค้าถูกค้นพบจำนวนมากบนโลกออนไลน์ ดังนั้น การวิเคราะห์ความรู้สึกจึงกลายเป็นเครื่องมือสำหรับธุรกิจในการวิเคราะห์ข้อมูลเชิงลึกจากข้อมูลขนาดใหญ่เกี่ยวกับความต้องการและการรับรู้ของลูกค้าที่มีต่อแบรนด์ ในการศึกษานี้ ผู้วิจัยมีวัตถุประสงค์เพื่อทำการทดลองโดยใช้ชุดข้อมูลแบบเปิด (Yelp Coffee Review) จากเว็บไซต์ kaggle.com เป็นกรณีศึกษาและใช้วิธีการประมวลผลภาษาธรรมชาติมาประยุกต์ใช้กับแบบจำลอง Transformer-based ทั้งสามชนิด ได้แก่ BERT, ALBERT และ RoBERTa โดยมี Classifications หกประเภทที่แตกต่างกัน ได้แก่ Logistic Regression, Naive Bayes, Decision Tree, Random Forest, Support Vector Machine และ K-Nearest Neighbors เพื่อเปรียบเทียบประสิทธิภาพ โดยเทคนิคการจัดการข้อมูลที่ไม่สมดุลและการเพิ่มประสิทธิภาพของ Hyperparameter จะถูกนำมาพิจารณาในการศึกษานี้ด้วย จากผลการทดลองพบว่า แบบจำลอง RoBERTa ทำงานได้ดีที่สุดที่ความแม่นยำ 98.84% ในขณะที่แบบจำลอง Transformer-based ทั้งสามแบบมีประสิทธิภาพดีกว่าแบบจำลองทั่วไปตามที่คาดไว้ ดังนั้น การศึกษาแบบจำลองนี้ได้พิสูจน์ให้เห็นถึงประสิทธิภาพและประโยชน์ต่อธุรกิจเกี่ยวกับเครื่องมือวิเคราะห์ความรู้สึกของลูกค้าการนำผลของสารนิพนธ์ไปใช้:ผลการวิจัยระบุว่า แบบจำลอง Transformer ทั้งสามแบบที่นำมาใช้ในการทดลอง มีประโยชน์ที่สำคัญต่อมุมมองธุรกิจ สำหรับการวิเคราะห์ความพึงพอใจโดยการวิเคราะห์ข้อมูลความคิดเห็นของลูกค้าอย่างแม่นยำ ข้อมูลเชิงลึกนี้สามารถสนับสนุนธุรกิจในแง่ของการตัดสินใจ ปรับปรุงประสบการณ์ของลูกค้า และพัฒนาแผนกลยุทธ์ทางการตลาดให้เหมาะสมtha
dc.format.extentxiii, 130 leaves : ill.
dc.format.mimetypeapplication/pdf
dc.identifier.citationThematic Paper (M.Sc. (Information Technology Management))--Mahidol University, 2023
dc.identifier.urihttps://repository.li.mahidol.ac.th/handle/123456789/115303
dc.language.isoeng
dc.publisherMahidol University
dc.rightsผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
dc.rights.holderMahidol University
dc.subjectSentiment analysis -- Data processing.
dc.subjectNatural language processing (Computer science)
dc.subjectCustomer relations -- Data processing.
dc.subjectMachine learning -- Research.
dc.subjectBusiness planning -- Data processing.
dc.subjectM.Sc. (2023)
dc.subjectInformation Technology Management (Mahidol University 2023)
dc.titleTransformer-based modelling for sentiment analysis of coffee review
dc.title.alternativeการสร้างโมเดลวิเคราะห์ความรู้สึกของรีวิวกาแฟจากแบบจำลอง Transformer
dc.typeMaster Thesis
dcterms.accessRightsopen access
thesis.degree.departmentFaculty of Engineering
thesis.degree.disciplineInformation Technology Management
thesis.degree.grantorMahidol University
thesis.degree.levelMaster's degree
thesis.degree.nameMaster of Science

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
TH_Atiphan_C_2023.pdf
Size:
7.67 MB
Format:
Adobe Portable Document Format