ข้อมูลทางการเงินเป็นหนึ่งในข้อมูล อนุกรมเวลา(Time Series) ลักษณะการทำนายแตกต่างจากข้อมูลทั่วไป เราจึงจะมาพูดถึงแบบจำลองที่นิยมมากที่สุดในการวิเคราะห์อนุกรมเวลา แบบจำลองนี้มีชื่อว่า ARIMA Model
ที่ถูกใช้อย่างกว้างขว้าง ไม่ว่าจะเป็นการเงินเศรษฐสาตร์ การทำนายยอดขายหรือแม้แต่ Social media.
ARIMA Model?
ARIMA Model
เป็นแบบจำลองทางสถิติที่จับรูปแบบและวิเคราะห์แนวโน้มของข้อมูลที่แยกองค์ประกอบเป็น Trend และ seasonality โดยแบ่งองค์ประกอบเป็น
AR (AutoRegressive) Component: คือการใช้ค่าที่ได้จากอดีต(lags) เพื่อทำนายค่าในอนาคต
I (Integrated) Component:การแยกความแตกต่างของอนุกรมเวลาให้คงที่ (ลบแนวโน้มหรือความเป็นฤดูกาล)
MA (Moving Average) Component: ใช้ข้อผิดพลาดในการคาดการณ์ในอดีตเพื่อแก้ไขการคาดการณ์ในอนาคต
แบบจำลองแสดงเป็น ARIMA(p, d, q) โดยที่:
p = Number of lag observations (AR component)
d =จำนวนของ differences เพื่อให้ข้อมูลเป็น stationary (I component)
q = moving average window (MA component)
พารามิเตอร์บน ARIMA Model
p (Order of AR): คือตัวแปรที่ควบคุมจำนวนตัวแปรก่อนหน้าที่ใช้ทำนายอนาคต
d (Order of Differencing): คือจำนวนของการทำ differenced เพื่อให้ข้อมูล stationarity.
q (Order of MA): คือค่าที่เราควบคุม errors ในอดีต
It controls the number of past forecast errors included in the prediction model.
แล้วเราจะใส่ค่าพารามิเตอร์แต่ละตัวอย่างไรดีแหละ.....
วิธีที่เป็นมาตรฐานคือ Akaike Information Criterion (AIC) เป็นแนวคิดที่สำคัญในการกำหนดตัวแปรใน ARIMA Mode ใช้เพื่อประเมินความเหมาะสมของแบบจำลองทางสถิติ พร้อมทั้งลงโทษความซับซ้อน(Overfitting)ของแบบจำลองด้วย
AIC เป็นตัววัดคุณภาพสัมพันธ์ของแบบจำลองทางสถิติสำหรับชุดข้อมูลที่กำหนด AIC ช่วยในการเลือกแบบจำลองโดยการสร้างสมดุลระหว่างความพอดีและความเรียบง่ายของแบบจำลอง สูตรสำหรับ AIC คือ:
เมื่อ:
k = จำนวนตัวแปรของแปรจำลอง
L = likelihood ของแบบจำลองที่ได้จากข้อมูล
ขั้นตอนในการสร้าง ARIMA Model
ลอง พอร์ต Time Series ก่อน
การ์ตทำให้เราสามารถเห็นว่าข้อมูลมันมีแนวโน้ม ฤดูกาลหรือวัฏจักรหรือไม่
เช็ค Stationarity
เช็ค Stationarity โดยอาจใช้ Augmented Dickey-Fuller (ADF) ถ้าไม่ stationary เราก็ diff จนมัน stationary
ระบุค่า p, d, q
Fit the ARIMA Model
Validate the Model
เช็คค่า error ว่ามันอยู่ในเกร์ณที่นำไปใช้ได้
ทำนายค่าในอนาคต
ARIMA Extension Models
SARIMA (Seasonal ARIMA): SARIMA เป็น Extension ของ ARIMA ที่รวมความเป็นฤดูกาลเข้ามาในโมเดล โดยเพิ่มพารามิเตอร์ตามฤดูกาล 4 ตัว ได้แก่ (P, D, Q, m) ซึ่งมีความหมายดังนี้:
p: ลำดับการถดถอยอัตโนมัติตามฤดูกาล (คล้ายกับ p แต่ใช้สำหรับช่วงฤดูกาล)
d: การหาความแตกต่างตามฤดูกาลที่จำเป็นเพื่อขจัดรูปแบบตามฤดูกาล (เหมือน d แต่สำหรับรูปแบบตามฤดูกาล)
q: ลำดับของค่าเฉลี่ยเคลื่อนที่ตามฤดูกาล (คล้ายกับ q แต่ใช้สำหรับข้อผิดพลาดตามฤดูกาล)
m: จำนวนขั้นเวลาภายในรอบฤดูกาลหนึ่งรอบ (เช่น m=12 สำหรับข้อมูลรายเดือนที่มีรอบปี)
โมเดล SARIMA ถูกแทนด้วยรูปแบบ SARIMA(p, d, q)(P, D, Q, m) โมเดลนี้มีประโยชน์อย่างยิ่งสำหรับข้อมูลอนุกรมเวลาที่มีรูปแบบซ้ำ เช่น ยอดขายรายเดือน ความต้องการตามฤดูกาล หรือการเปลี่ยนแปลงของอุณหภูมิ โดย SARIMA จะช่วยปรับปรุง ARIMA ให้สามารถพิจารณารอบวัฏจักรตามฤดูกาล ทำให้สามารถคาดการณ์ได้แม่นยำยิ่งขึ้นสำหรับข้อมูลที่มีความผันผวนตามฤดูกาล
SARIMAX (Seasonal ARIMA with Exogenous Regressors):SARIMAX เป็น Extension โมเดล SARIMA โดยเพิ่มปัจจัยภายนอก (Exogenous Variables - X) เข้าไปในโมเดล ปัจจัยภายนอกเหล่านี้สามารถมีอิทธิพลต่อพฤติกรรมของตัวแปรตาม เช่น การส่งเสริมการขาย วันหยุด หรือสภาพอากาศที่อาจมีผลต่อยอดขาย
โมเดล SARIMAX ถูกแทนด้วยรูปแบบ SARIMA(p, d, q)(P, D, Q, m) + X โดยที่ X หมายถึงตัวแปรอิสระที่มีผลกระทบต่อตัวแปรเป้าหมาย การรวมปัจจัยภายนอกเหล่านี้เข้าไปในโมเดลจะช่วยเพิ่มความแม่นยำในการคาดการณ์ โดยเฉพาะในกรณีที่ตัวแปรอื่น ๆ มีผลกระทบอย่างมีนัยสำคัญต่ออนุกรมเวลา
ARIMAX (ARIMA with Exogenous Regressors):ARIMAX เป็นโมเดลที่ไม่มีส่วนประกอบตามฤดูกาล (non-seasonal) และเป็น Extension ARIMA โดยเพิ่มปัจจัยภายนอก (Exogenous Variables - X) เข้าไปในโมเดลเช่นเดียวกับ SARIMAX
โมเดล ARIMAX ถูกแทนด้วยรูปแบบ ARIMA(p, d, q) + X ซึ่งเหมาะสำหรับข้อมูลอนุกรมเวลาที่ไม่มีฤดูกาลแต่มีปัจจัยภายนอกที่มีผลกระทบ ตัวอย่างเช่น ในธุรกิจค้าปลีก ค่าใช้จ่ายในการโฆษณาอาจมีผลต่อยอดขายรายวัน การรวมตัวแปรนี้เป็นปัจจัยอิสระจะช่วยปรับปรุงความแม่นยำของการพยากรณ์ในโมเดล ARIMA
VAR (Vector AutoRegression):VAR แตกต่างจาก ARIMA ตรงที่ VAR ใช้สำหรับข้อมูลอนุกรมเวลาที่มีหลายตัวแปร (Multivariate Time Series) ซึ่ง ARIMA ใช้กับข้อมูลเพียงชุดเดียว (Univariate Time Series) VAR จะพิจารณาความสัมพันธ์ระหว่างอนุกรมเวลาแต่ละชุด โดยใช้ค่าในอดีตของตัวแปรหลายตัวมาทำนายตัวแปรอื่น แต่ละตัวแปรจะถูกพิจารณาเป็นตัวแปรตาม และมีการถดถอย (regression) บนค่าในอดีตของตัวเองและค่าในอดีตของตัวแปรอื่น ๆ ตัวอย่างการใช้งาน VAR ได้แก่ การคาดการณ์ความสัมพันธ์ระหว่างผลิตภัณฑ์มวลรวมในประเทศ (GDP) อัตราเงินเฟ้อ และอัตราการว่างงาน ซึ่งเป็นตัวแปรที่มีผลกระทบต่อกันและกัน VAR เหมาะสมสำหรับการคาดการณ์ความสัมพันธ์ระหว่างตัวแปรทางเศรษฐกิจและการเงิน
VECM (Vector Error Correction Model):VECM เป็นการขยายโมเดล VAR แต่จะใช้ในกรณีที่อนุกรมเวลามีการ "ร่วมบูรณาการ" (cointegration) กัน กล่าวคือ ตัวแปรหลายตัวมีความสัมพันธ์ในระยะยาวและอาจเบี่ยงเบนจากความสัมพันธ์นี้ในระยะสั้น VECM จะทำการปรับแก้ไขความเบี่ยงเบนในระยะสั้นเพื่อกลับไปสู่ความสมดุลในระยะยาว โดยพิจารณาการปรับเปลี่ยนทั้งในระยะสั้นและระยะยาว ตัวอย่างเช่น ในเศรษฐศาสตร์ ตัวแปรอย่างอัตราดอกเบี้ยและอัตราเงินเฟ้อมักจะมีความสัมพันธ์แบบร่วมบูรณาการ และ VECM จะช่วยอธิบายกระบวนการปรับสมดุลเมื่อมีการเบี่ยงเบนจากความสมดุลในระยะยาว
ข้อสรุป
โมเดล ARIMA เป็นเครื่องมือที่มีความยืดหยุ่นและทรงพลังสำหรับการพยากรณ์อนุกรมเวลา โดยสามารถจำลองแนวโน้ม (trend) วัฏจักร (cycle) และความผิดพลาดแบบสุ่ม (random error) ได้อย่างมีประสิทธิภาพ จึงเป็นตัวเลือกที่มีคุณค่าในการพยากรณ์ในหลากหลายสาขา เช่น การเงิน ค้าปลีก และพลังงาน
ความสามารถของ ARIMA ในการจัดการข้อมูลที่ไม่อยู่ในภาวะนิ่ง (non-stationary) ผ่านกระบวนการหาความแตกต่าง (differencing) และการปรับเอฟเฟกต์ของการหน่วงเวลา (lag) และค่าเฉลี่ยเคลื่อนที่ (moving average) ทำให้สามารถสร้างการพยากรณ์ระยะสั้นที่แม่นยำและแข็งแกร่งได้ อย่างไรก็ตาม ARIMA ต้องการให้ข้อมูลมีความนิ่ง (stationary) และถูกจำกัดให้ใช้ได้กับอนุกรมเวลาที่มีเพียงตัวแปรเดียว (univariate forecasting)
ข้อจำกัดเหล่านี้สามารถแก้ไขได้ด้วยการขยาย ARIMA เช่น SARIMA และ SARIMAX ซึ่งช่วยเพิ่มความสามารถในการจัดการข้อมูลที่มีความผันผวนตามฤดูกาลและปัจจัยภายนอก ด้วยการเข้าใจและเชี่ยวชาญในกระบวนการ ARIMA นักธุรกิจและนักวิเคราะห์สามารถใช้ข้อมูลเพื่อขับเคลื่อนการตัดสินใจ ลดความเสี่ยง ปรับปรุงประสิทธิภาพการดำเนินงาน และเพิ่มผลลัพธ์ทางการเงินได้อย่างมีประสิทธิภาพ
Comments