Sentiment analysis and relationship between social media and stock market : Pantip.Com and Stock Exchange of Thailand (SET)
Issued Date
2024
Copyright Date
2018
Language
eng
File Type
application/pdf
No. of Pages/File Size
ix, 99 leaves : ill.
Access Rights
open access
Rights
ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thesis (M.Sc. (Information Technology Management))--Mahidol University, 2018
Suggested Citation
Praewmai Padhanarath Sentiment analysis and relationship between social media and stock market : Pantip.Com and Stock Exchange of Thailand (SET). Thesis (M.Sc. (Information Technology Management))--Mahidol University, 2018. Retrieved from: https://repository.li.mahidol.ac.th/handle/20.500.14594/91772
Title
Sentiment analysis and relationship between social media and stock market : Pantip.Com and Stock Exchange of Thailand (SET)
Alternative Title(s)
การวิเคราะห์อารมณ์จากข้อความและความสัมพันธ์ระหว่างโซเชียลมีเดียกับตลาดหุ้น : เว็บไซต์พันทิปและตลาดหลักทรัพย์แห่งประเทศไทย
Author(s)
Abstract
This research proposes a process flow of social media sentiment analysis to explain the relationship between comments on social media and stock market data. One of the popular social media for investors in Stock Exchange of Thailand (SET) is Pantip.com, a website providing service as a web board with tagging feature. In this research, all posts tagged by 'Stock' on this website were crawled into text files. Then the comments were taken through data cleansing process to eliminate the data defects. For a model training, some comments were labelled and grouped into three classes including positive, negative and neutral classes. Sentiment analysis model was created by Naive Bayes Classification Technique. In evaluation, the model performance was shown to be at 74 % accuracy. This model was utilized to classify the comments into sentiments. When all comments were completely classed, the sentiment types were counted by date. Finally, correlation matrices were constructed to find the relationship between the number of sentiments and stock data. It found that the number of sentiments from social media relates to ADVANC and CPALL stock volumes. Moreover, the correlation always reaches to the peak on the trading day then it gradually declines with the magnitude depending on the day length after the trading day.
วิจัยฉบับนี้ จัดทำขึ้นเพื่อเสนอกระบวนการ วิเคราะห์อารมณ์จากข้อความบนโซเชียล มีเดียและ นำมาอธิบายความสัมพันธ์ระหว่างความคิดเห็นกับหุ้นโดยโซเชียลมีเดียที่เป็นที่นิยมของนักลงทุนไทยคือเว็บไซต์พันซึ่งเป็นเว็บที่ให้บริการด้านเว็บบอร์ด ที่สามารถทำการแท็กประเภทของกระทู้เพื่อให้ง่ายต่อการสืบค้นได้โดยวิจัยฉบับนี้ ได้นำข้อความจากกระทู้ที่มีการติดแท็กหุ้นมาใช้ในการฝึกฝนโมเดลเพื่อวิเคราะห์ความเชื่อมั่นของนักลงทุนที่มีผลต่อราคาหุ้นโคยแบ่งความ เชื่อมั่นออกเป็น 3 ประเภท ได้แก่ ความเชื่อมั่นที่ส่งผลต่อราคาหุ้นในเชิงบวก ความเชื่อมั่นที่ส่งผลต่อราคาหุ้นในเชิงลบ และ ไม่ส่งผลต่อราคาหุ้นโดยโมเดลที่สร้างจะ ใช้เทคนิคการแบ่งแบบนาอีฟเบย์ซึ่ง จากผลการฝึกฝนโมเดลพบว่าโมเดลมีความแม่นยำถึง 74 เปอร์เซ็นต์และเมื่อนำจำนวนข้อความที่ได้ จากการแบ่งตามความเชื่อมั่นของนักลงทุนนั้นมาหาความสัมพันธ์กับราคาและปริมาณการซื้อขาย หุ้นพบว่าจำนวนข้อความบนเว็บไซต์พันทิปมีความสัมพันธ์เชิงบวกกับปริมาณการซื้อขายหุ้น ADVANC และ CPALL นอกจากนี้ ค่าประสัมประสิทธิ์สหสัมพันธ์ระหว่างจำนวนข้อความกับปริมาณการซื้อขายจะสูงที่สุดในวันที่มีการซื้อขายหุ้นนั้น ๆ และ จะมีค่าลดลงในวันถัดไป
วิจัยฉบับนี้ จัดทำขึ้นเพื่อเสนอกระบวนการ วิเคราะห์อารมณ์จากข้อความบนโซเชียล มีเดียและ นำมาอธิบายความสัมพันธ์ระหว่างความคิดเห็นกับหุ้นโดยโซเชียลมีเดียที่เป็นที่นิยมของนักลงทุนไทยคือเว็บไซต์พันซึ่งเป็นเว็บที่ให้บริการด้านเว็บบอร์ด ที่สามารถทำการแท็กประเภทของกระทู้เพื่อให้ง่ายต่อการสืบค้นได้โดยวิจัยฉบับนี้ ได้นำข้อความจากกระทู้ที่มีการติดแท็กหุ้นมาใช้ในการฝึกฝนโมเดลเพื่อวิเคราะห์ความเชื่อมั่นของนักลงทุนที่มีผลต่อราคาหุ้นโคยแบ่งความ เชื่อมั่นออกเป็น 3 ประเภท ได้แก่ ความเชื่อมั่นที่ส่งผลต่อราคาหุ้นในเชิงบวก ความเชื่อมั่นที่ส่งผลต่อราคาหุ้นในเชิงลบ และ ไม่ส่งผลต่อราคาหุ้นโดยโมเดลที่สร้างจะ ใช้เทคนิคการแบ่งแบบนาอีฟเบย์ซึ่ง จากผลการฝึกฝนโมเดลพบว่าโมเดลมีความแม่นยำถึง 74 เปอร์เซ็นต์และเมื่อนำจำนวนข้อความที่ได้ จากการแบ่งตามความเชื่อมั่นของนักลงทุนนั้นมาหาความสัมพันธ์กับราคาและปริมาณการซื้อขาย หุ้นพบว่าจำนวนข้อความบนเว็บไซต์พันทิปมีความสัมพันธ์เชิงบวกกับปริมาณการซื้อขายหุ้น ADVANC และ CPALL นอกจากนี้ ค่าประสัมประสิทธิ์สหสัมพันธ์ระหว่างจำนวนข้อความกับปริมาณการซื้อขายจะสูงที่สุดในวันที่มีการซื้อขายหุ้นนั้น ๆ และ จะมีค่าลดลงในวันถัดไป
Description
Information Technology Management (Mahidol University 2018)
Degree Name
Master of Science
Degree Level
Master's degree
Degree Department
Faculty of Engineering
Degree Discipline
Information Technology Management
Degree Grantor(s)
Mahidol University