Transformer-based modelling for sentiment analysis of coffee review
1
2
Issued Date
2023
Copyright Date
2023
Resource Type
Language
eng
File Type
application/pdf
No. of Pages/File Size
xiii, 130 leaves : ill.
Access Rights
open access
Rights
ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thematic Paper (M.Sc. (Information Technology Management))--Mahidol University, 2023
Suggested Citation
Atiphan Charoenphon Transformer-based modelling for sentiment analysis of coffee review. Thematic Paper (M.Sc. (Information Technology Management))--Mahidol University, 2023. Retrieved from: https://repository.li.mahidol.ac.th/handle/123456789/115303
Title
Transformer-based modelling for sentiment analysis of coffee review
Alternative Title(s)
การสร้างโมเดลวิเคราะห์ความรู้สึกของรีวิวกาแฟจากแบบจำลอง Transformer
Author(s)
Advisor(s)
Abstract
The development of social networks contributes to the growth of online content that becomes more relevant to the business. Customer reviews, feedback, and comments have been found mentioned online. Thus, sentiment analysis becomes a tool for businesses to extract insightful information from big data regarding customers’ needs and perceptions towards brands. In this study, the researcher aimed to set the experiments using an open dataset (Yelp Coffee Review) from kaggle.com as a case study. The natural language processing model was implemented by applying the Transformer-based models: BERT, ALBERT and RoBERTa, with six different classifications, including Logistic Regression, Naive Bayes, Decision Tree, Random Forest, Support Vector Machine, and K-Nearest Neighbors, to compare the performance, where imbalance data and hyperparameters have been considered in this study. In the experimental result, the research found that the RoBERTa model with Random Forest classifier performs best at 98.84% accuracy, while all the Transformer-based models outperform the conventional models as expected. Therefore, the models have proved their efficiency and advantage in shedding light on the customer sentiment analysis tool for business. Implication of the thematic paper: The findings of the study indicate that Transformer-based models offer businesses significant advantages and efficiencies for sentiment analysis by accurately analyzing customer sentiment data. The insightful data could support businesses in terms of decision-making, improving customer experiences, and optimizing marketing strategies.
การพัฒนาการของโซเชียลเน็ตเวิร์กมีส่วนทำให้คอนเทนต์ออนไลน์มีความเกี่ยวข้องกับธุรกิจมากขึ้น คำวิจารณ์ คำติชม และความคิดเห็นของลูกค้าถูกค้นพบจำนวนมากบนโลกออนไลน์ ดังนั้น การวิเคราะห์ความรู้สึกจึงกลายเป็นเครื่องมือสำหรับธุรกิจในการวิเคราะห์ข้อมูลเชิงลึกจากข้อมูลขนาดใหญ่เกี่ยวกับความต้องการและการรับรู้ของลูกค้าที่มีต่อแบรนด์ ในการศึกษานี้ ผู้วิจัยมีวัตถุประสงค์เพื่อทำการทดลองโดยใช้ชุดข้อมูลแบบเปิด (Yelp Coffee Review) จากเว็บไซต์ kaggle.com เป็นกรณีศึกษาและใช้วิธีการประมวลผลภาษาธรรมชาติมาประยุกต์ใช้กับแบบจำลอง Transformer-based ทั้งสามชนิด ได้แก่ BERT, ALBERT และ RoBERTa โดยมี Classifications หกประเภทที่แตกต่างกัน ได้แก่ Logistic Regression, Naive Bayes, Decision Tree, Random Forest, Support Vector Machine และ K-Nearest Neighbors เพื่อเปรียบเทียบประสิทธิภาพ โดยเทคนิคการจัดการข้อมูลที่ไม่สมดุลและการเพิ่มประสิทธิภาพของ Hyperparameter จะถูกนำมาพิจารณาในการศึกษานี้ด้วย จากผลการทดลองพบว่า แบบจำลอง RoBERTa ทำงานได้ดีที่สุดที่ความแม่นยำ 98.84% ในขณะที่แบบจำลอง Transformer-based ทั้งสามแบบมีประสิทธิภาพดีกว่าแบบจำลองทั่วไปตามที่คาดไว้ ดังนั้น การศึกษาแบบจำลองนี้ได้พิสูจน์ให้เห็นถึงประสิทธิภาพและประโยชน์ต่อธุรกิจเกี่ยวกับเครื่องมือวิเคราะห์ความรู้สึกของลูกค้าการนำผลของสารนิพนธ์ไปใช้:ผลการวิจัยระบุว่า แบบจำลอง Transformer ทั้งสามแบบที่นำมาใช้ในการทดลอง มีประโยชน์ที่สำคัญต่อมุมมองธุรกิจ สำหรับการวิเคราะห์ความพึงพอใจโดยการวิเคราะห์ข้อมูลความคิดเห็นของลูกค้าอย่างแม่นยำ ข้อมูลเชิงลึกนี้สามารถสนับสนุนธุรกิจในแง่ของการตัดสินใจ ปรับปรุงประสบการณ์ของลูกค้า และพัฒนาแผนกลยุทธ์ทางการตลาดให้เหมาะสม
การพัฒนาการของโซเชียลเน็ตเวิร์กมีส่วนทำให้คอนเทนต์ออนไลน์มีความเกี่ยวข้องกับธุรกิจมากขึ้น คำวิจารณ์ คำติชม และความคิดเห็นของลูกค้าถูกค้นพบจำนวนมากบนโลกออนไลน์ ดังนั้น การวิเคราะห์ความรู้สึกจึงกลายเป็นเครื่องมือสำหรับธุรกิจในการวิเคราะห์ข้อมูลเชิงลึกจากข้อมูลขนาดใหญ่เกี่ยวกับความต้องการและการรับรู้ของลูกค้าที่มีต่อแบรนด์ ในการศึกษานี้ ผู้วิจัยมีวัตถุประสงค์เพื่อทำการทดลองโดยใช้ชุดข้อมูลแบบเปิด (Yelp Coffee Review) จากเว็บไซต์ kaggle.com เป็นกรณีศึกษาและใช้วิธีการประมวลผลภาษาธรรมชาติมาประยุกต์ใช้กับแบบจำลอง Transformer-based ทั้งสามชนิด ได้แก่ BERT, ALBERT และ RoBERTa โดยมี Classifications หกประเภทที่แตกต่างกัน ได้แก่ Logistic Regression, Naive Bayes, Decision Tree, Random Forest, Support Vector Machine และ K-Nearest Neighbors เพื่อเปรียบเทียบประสิทธิภาพ โดยเทคนิคการจัดการข้อมูลที่ไม่สมดุลและการเพิ่มประสิทธิภาพของ Hyperparameter จะถูกนำมาพิจารณาในการศึกษานี้ด้วย จากผลการทดลองพบว่า แบบจำลอง RoBERTa ทำงานได้ดีที่สุดที่ความแม่นยำ 98.84% ในขณะที่แบบจำลอง Transformer-based ทั้งสามแบบมีประสิทธิภาพดีกว่าแบบจำลองทั่วไปตามที่คาดไว้ ดังนั้น การศึกษาแบบจำลองนี้ได้พิสูจน์ให้เห็นถึงประสิทธิภาพและประโยชน์ต่อธุรกิจเกี่ยวกับเครื่องมือวิเคราะห์ความรู้สึกของลูกค้าการนำผลของสารนิพนธ์ไปใช้:ผลการวิจัยระบุว่า แบบจำลอง Transformer ทั้งสามแบบที่นำมาใช้ในการทดลอง มีประโยชน์ที่สำคัญต่อมุมมองธุรกิจ สำหรับการวิเคราะห์ความพึงพอใจโดยการวิเคราะห์ข้อมูลความคิดเห็นของลูกค้าอย่างแม่นยำ ข้อมูลเชิงลึกนี้สามารถสนับสนุนธุรกิจในแง่ของการตัดสินใจ ปรับปรุงประสบการณ์ของลูกค้า และพัฒนาแผนกลยุทธ์ทางการตลาดให้เหมาะสม
Degree Name
Master of Science
Degree Level
Master's degree
Degree Department
Faculty of Engineering
Degree Discipline
Information Technology Management
Degree Grantor(s)
Mahidol University
