Gold price volatility prediction by text mining in economic indicators news
Issued Date
2015
Copyright Date
2015
Resource Type
Language
eng
File Type
application/pdf
No. of Pages/File Size
ix, 74 leaves : ill.
Access Rights
open access
Rights
ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thesis (M.Sc. (Information Technology Management))--Mahidol University, 2015
Suggested Citation
Chanwit Onsumran Gold price volatility prediction by text mining in economic indicators news. Thesis (M.Sc. (Information Technology Management))--Mahidol University, 2015. Retrieved from: https://repository.li.mahidol.ac.th/handle/20.500.14594/94033
Title
Gold price volatility prediction by text mining in economic indicators news
Alternative Title(s)
การทำนายความผันผวนของราคาทองคำโดยวิธีเหมืองข้อความในบทความข่าวชี้วัดทางเศรษฐกิจ
Author(s)
Abstract
This research focuses on the text mining approach of the gold prices volatility prediction model from the text of economic indicators news articles. The model is designed and developed to analyze how the news articles influence gold price volatility. The selected reliable source of news articles is provided by FXStreet, which offers several economic indicators. The data will be used to build text classifiers and news group affecting volatility price of gold. According to the fundamentals of the data mining process, each news article is firstly transformed in to a feature by the TF-IDF method. Then, a comparative experiment is set up to measure the accuracy of the combination of two attributes weighting approaches - which are Support Vector Machine (SVM) and Chi-Squared Statistic - and three classification algorithms - which are the k-Nearest Neighbors, SVM and Naive Bayes. The results show that the SVM classification algorithm, weighted by SVM, is the best among all tests with an accuracy of 87.52%. In the future, it can be developed to improve the classification system; it may be input to other economic news for more factors to increase the efficiency of analyzing consequences that affect the volatility of the gold price.
งานวิจัยนี้มุ่งเน้นไปที่วิธีการทำเหมืองข้อความจากบทความข่าวชี้วัดทางเศษรฐกิจ เพื่อทำนายความผันผวนของราคาทองคำ โดยทำนายความผันผวนจากรูปแบบของข่าวซึ่งจะเป็นข้อความข่าวชี้วัดทางเศรษฐกิจ โดยจะออกแบบและพัฒนาขึ้นเพื่อวิเคราะห์บทความข่าวที่มีอิทธิพลต่อความผันผวนของราคาทองคำ โดยข้อมูลบทความข่าวที่นำมาใช้ในงานวิจัยนี้คือข้อมูลจากเว็บไซต์ FXStreet ซึ่งเป็นแหล่งข้อมูลที่เป็นสากลและมีความน่าเชื่อถือ โดยได้เลือกบทความข่าวทางเศรษฐกิจที่มีความเกี่ยวข้องกับงานวิจัยในครั้งนี้มาวิเคราะห์ ซึ่งข้อมูลจะถูกนำมาใช้ในการสร้างรูปแบบสำหรับการจัดหมวดหมู่ของข้อความ และ กลุ่มข่าวที่มีผลต่อความผันผวนของราคาทองคำตามพื้นฐานของกระบวนการทำเหมืองข้อความ โดยใช้การให้ค่าน้ำหนักของคำในเอกสารด้วยวิธี TF/IDF จากนั้นทดลองเปรียบเทียบประเมินผลความถูกต้องด้วยการเลือกใช้ Attributes Weighting ซึ่งประกอบด้วยวิธีการของ Support Vector Machine และ วิธี Chi-Squared Statistic โดยใช้เทคนิค Classification Algorithms ทั้งหมด 3 วิธี ประกอบด้วย k-Nearest Neighbors, SVM และ Naïve Bayes ซึ่งผลการศึกษาพบว่าวิธี SVM โดยการเลือกใช้ Attributes Weighting Support Vector Machine มีความถูกต้องมากที่สุดร้อยละ 87.52 ซึ่งการวิจัยในอนาคตสามารถที่จะพัฒนาและปรับปรุงรูปแบบการจำแนกข้อความโดยอาจจะเป็นการเพิ่มปัจจัยข้อมูลข่าวเศรษฐกิจด้านอื่น ๆ เพิ่มเติมเพื่อเพิ่มประสิทธิภาพในการวิเคราะห์ผลกระทบที่ส่งผลต่อความผันผวนของราคาทองคำต่อไป
งานวิจัยนี้มุ่งเน้นไปที่วิธีการทำเหมืองข้อความจากบทความข่าวชี้วัดทางเศษรฐกิจ เพื่อทำนายความผันผวนของราคาทองคำ โดยทำนายความผันผวนจากรูปแบบของข่าวซึ่งจะเป็นข้อความข่าวชี้วัดทางเศรษฐกิจ โดยจะออกแบบและพัฒนาขึ้นเพื่อวิเคราะห์บทความข่าวที่มีอิทธิพลต่อความผันผวนของราคาทองคำ โดยข้อมูลบทความข่าวที่นำมาใช้ในงานวิจัยนี้คือข้อมูลจากเว็บไซต์ FXStreet ซึ่งเป็นแหล่งข้อมูลที่เป็นสากลและมีความน่าเชื่อถือ โดยได้เลือกบทความข่าวทางเศรษฐกิจที่มีความเกี่ยวข้องกับงานวิจัยในครั้งนี้มาวิเคราะห์ ซึ่งข้อมูลจะถูกนำมาใช้ในการสร้างรูปแบบสำหรับการจัดหมวดหมู่ของข้อความ และ กลุ่มข่าวที่มีผลต่อความผันผวนของราคาทองคำตามพื้นฐานของกระบวนการทำเหมืองข้อความ โดยใช้การให้ค่าน้ำหนักของคำในเอกสารด้วยวิธี TF/IDF จากนั้นทดลองเปรียบเทียบประเมินผลความถูกต้องด้วยการเลือกใช้ Attributes Weighting ซึ่งประกอบด้วยวิธีการของ Support Vector Machine และ วิธี Chi-Squared Statistic โดยใช้เทคนิค Classification Algorithms ทั้งหมด 3 วิธี ประกอบด้วย k-Nearest Neighbors, SVM และ Naïve Bayes ซึ่งผลการศึกษาพบว่าวิธี SVM โดยการเลือกใช้ Attributes Weighting Support Vector Machine มีความถูกต้องมากที่สุดร้อยละ 87.52 ซึ่งการวิจัยในอนาคตสามารถที่จะพัฒนาและปรับปรุงรูปแบบการจำแนกข้อความโดยอาจจะเป็นการเพิ่มปัจจัยข้อมูลข่าวเศรษฐกิจด้านอื่น ๆ เพิ่มเติมเพื่อเพิ่มประสิทธิภาพในการวิเคราะห์ผลกระทบที่ส่งผลต่อความผันผวนของราคาทองคำต่อไป
Description
Information Technology Management (Mahidol University 2015)
Degree Name
Master of Science
Degree Level
Master's degree
Degree Department
Faculty of Engineering
Degree Discipline
Information Technology Management
Degree Grantor(s)
Mahidol University