top of page

ARIMA Model: ท็อบแบบจำลองในการวิเคราะห์อนุกรมเวลา

ข้อมูลทางการเงินเป็นหนึ่งในข้อมูล อนุกรมเวลา(Time Series) ลักษณะการทำนายแตกต่างจากข้อมูลทั่วไป เราจึงจะมาพูดถึงแบบจำลองที่นิยมมากที่สุดในการวิเคราะห์อนุกรมเวลา แบบจำลองนี้มีชื่อว่า ARIMA Model

ที่ถูกใช้อย่างกว้างขว้าง ไม่ว่าจะเป็นการเงินเศรษฐสาตร์ การทำนายยอดขายหรือแม้แต่ Social media.


ARIMa Model


ARIMA Model?

ARIMA Model

เป็นแบบจำลองทางสถิติที่จับรูปแบบและวิเคราะห์แนวโน้มของข้อมูลที่แยกองค์ประกอบเป็น Trend และ seasonality โดยแบ่งองค์ประกอบเป็น

  • AR (AutoRegressive) Component: คือการใช้ค่าที่ได้จากอดีต(lags) เพื่อทำนายค่าในอนาคต

  • I (Integrated) Component:การแยกความแตกต่างของอนุกรมเวลาให้คงที่ (ลบแนวโน้มหรือความเป็นฤดูกาล)

  • MA (Moving Average) Component: ใช้ข้อผิดพลาดในการคาดการณ์ในอดีตเพื่อแก้ไขการคาดการณ์ในอนาคต

    แบบจำลองแสดงเป็น ARIMA(p, d, q) โดยที่:

  • p = Number of lag observations (AR component)

  • d =จำนวนของ differences เพื่อให้ข้อมูลเป็น stationary (I component)

  • q = moving average window (MA component)



พารามิเตอร์บน ARIMA Model

  1. p (Order of AR): คือตัวแปรที่ควบคุมจำนวนตัวแปรก่อนหน้าที่ใช้ทำนายอนาคต

  2. d (Order of Differencing): คือจำนวนของการทำ  differenced เพื่อให้ข้อมูล stationarity.

  3. q (Order of MA): คือค่าที่เราควบคุม errors ในอดีต

  4. It controls the number of past forecast errors included in the prediction model.

แล้วเราจะใส่ค่าพารามิเตอร์แต่ละตัวอย่างไรดีแหละ.....

วิธีที่เป็นมาตรฐานคือ Akaike Information Criterion (AIC) เป็นแนวคิดที่สำคัญในการกำหนดตัวแปรใน  ARIMA Mode ใช้เพื่อประเมินความเหมาะสมของแบบจำลองทางสถิติ พร้อมทั้งลงโทษความซับซ้อน(Overfitting)ของแบบจำลองด้วย


AIC เป็นตัววัดคุณภาพสัมพันธ์ของแบบจำลองทางสถิติสำหรับชุดข้อมูลที่กำหนด AIC ช่วยในการเลือกแบบจำลองโดยการสร้างสมดุลระหว่างความพอดีและความเรียบง่ายของแบบจำลอง สูตรสำหรับ AIC คือ:



Akaike Information Criterion (AIC)

เมื่อ:

  • k = จำนวนตัวแปรของแปรจำลอง

  • L = likelihood ของแบบจำลองที่ได้จากข้อมูล



ขั้นตอนในการสร้าง ARIMA Model

  1. ลอง พอร์ต Time Series ก่อน

    • การ์ตทำให้เราสามารถเห็นว่าข้อมูลมันมีแนวโน้ม ฤดูกาลหรือวัฏจักรหรือไม่

  2. เช็ค Stationarity

    • เช็ค Stationarity โดยอาจใช้ Augmented Dickey-Fuller (ADF) ถ้าไม่ stationary เราก็ diff จนมัน stationary

  3. ระบุค่า p, d, q

  4. Fit the ARIMA Model

  5. Validate the Model

    • เช็คค่า error ว่ามันอยู่ในเกร์ณที่นำไปใช้ได้

  6. ทำนายค่าในอนาคต




ARIMA Extension Models


  1. SARIMA (Seasonal ARIMA): SARIMA เป็น Extension ของ ARIMA ที่รวมความเป็นฤดูกาลเข้ามาในโมเดล โดยเพิ่มพารามิเตอร์ตามฤดูกาล 4 ตัว ได้แก่ (P, D, Q, m) ซึ่งมีความหมายดังนี้:

    • p: ลำดับการถดถอยอัตโนมัติตามฤดูกาล (คล้ายกับ p แต่ใช้สำหรับช่วงฤดูกาล)

    • d: การหาความแตกต่างตามฤดูกาลที่จำเป็นเพื่อขจัดรูปแบบตามฤดูกาล (เหมือน d แต่สำหรับรูปแบบตามฤดูกาล)

    • q: ลำดับของค่าเฉลี่ยเคลื่อนที่ตามฤดูกาล (คล้ายกับ q แต่ใช้สำหรับข้อผิดพลาดตามฤดูกาล)

    • m: จำนวนขั้นเวลาภายในรอบฤดูกาลหนึ่งรอบ (เช่น m=12 สำหรับข้อมูลรายเดือนที่มีรอบปี)

    โมเดล SARIMA ถูกแทนด้วยรูปแบบ SARIMA(p, d, q)(P, D, Q, m) โมเดลนี้มีประโยชน์อย่างยิ่งสำหรับข้อมูลอนุกรมเวลาที่มีรูปแบบซ้ำ เช่น ยอดขายรายเดือน ความต้องการตามฤดูกาล หรือการเปลี่ยนแปลงของอุณหภูมิ โดย SARIMA จะช่วยปรับปรุง ARIMA ให้สามารถพิจารณารอบวัฏจักรตามฤดูกาล ทำให้สามารถคาดการณ์ได้แม่นยำยิ่งขึ้นสำหรับข้อมูลที่มีความผันผวนตามฤดูกาล

  2. SARIMAX (Seasonal ARIMA with Exogenous Regressors):SARIMAX เป็น Extension โมเดล SARIMA โดยเพิ่มปัจจัยภายนอก (Exogenous Variables - X) เข้าไปในโมเดล ปัจจัยภายนอกเหล่านี้สามารถมีอิทธิพลต่อพฤติกรรมของตัวแปรตาม เช่น การส่งเสริมการขาย วันหยุด หรือสภาพอากาศที่อาจมีผลต่อยอดขาย

    โมเดล SARIMAX ถูกแทนด้วยรูปแบบ SARIMA(p, d, q)(P, D, Q, m) + X โดยที่ X หมายถึงตัวแปรอิสระที่มีผลกระทบต่อตัวแปรเป้าหมาย การรวมปัจจัยภายนอกเหล่านี้เข้าไปในโมเดลจะช่วยเพิ่มความแม่นยำในการคาดการณ์ โดยเฉพาะในกรณีที่ตัวแปรอื่น ๆ มีผลกระทบอย่างมีนัยสำคัญต่ออนุกรมเวลา

  3. ARIMAX (ARIMA with Exogenous Regressors):ARIMAX เป็นโมเดลที่ไม่มีส่วนประกอบตามฤดูกาล (non-seasonal) และเป็น Extension ARIMA โดยเพิ่มปัจจัยภายนอก (Exogenous Variables - X) เข้าไปในโมเดลเช่นเดียวกับ SARIMAX

    โมเดล ARIMAX ถูกแทนด้วยรูปแบบ ARIMA(p, d, q) + X ซึ่งเหมาะสำหรับข้อมูลอนุกรมเวลาที่ไม่มีฤดูกาลแต่มีปัจจัยภายนอกที่มีผลกระทบ ตัวอย่างเช่น ในธุรกิจค้าปลีก ค่าใช้จ่ายในการโฆษณาอาจมีผลต่อยอดขายรายวัน การรวมตัวแปรนี้เป็นปัจจัยอิสระจะช่วยปรับปรุงความแม่นยำของการพยากรณ์ในโมเดล ARIMA

  4. VAR (Vector AutoRegression):VAR แตกต่างจาก ARIMA ตรงที่ VAR ใช้สำหรับข้อมูลอนุกรมเวลาที่มีหลายตัวแปร (Multivariate Time Series) ซึ่ง ARIMA ใช้กับข้อมูลเพียงชุดเดียว (Univariate Time Series) VAR จะพิจารณาความสัมพันธ์ระหว่างอนุกรมเวลาแต่ละชุด โดยใช้ค่าในอดีตของตัวแปรหลายตัวมาทำนายตัวแปรอื่น แต่ละตัวแปรจะถูกพิจารณาเป็นตัวแปรตาม และมีการถดถอย (regression) บนค่าในอดีตของตัวเองและค่าในอดีตของตัวแปรอื่น ๆ ตัวอย่างการใช้งาน VAR ได้แก่ การคาดการณ์ความสัมพันธ์ระหว่างผลิตภัณฑ์มวลรวมในประเทศ (GDP) อัตราเงินเฟ้อ และอัตราการว่างงาน ซึ่งเป็นตัวแปรที่มีผลกระทบต่อกันและกัน VAR เหมาะสมสำหรับการคาดการณ์ความสัมพันธ์ระหว่างตัวแปรทางเศรษฐกิจและการเงิน

  5. VECM (Vector Error Correction Model):VECM เป็นการขยายโมเดล VAR แต่จะใช้ในกรณีที่อนุกรมเวลามีการ "ร่วมบูรณาการ" (cointegration) กัน กล่าวคือ ตัวแปรหลายตัวมีความสัมพันธ์ในระยะยาวและอาจเบี่ยงเบนจากความสัมพันธ์นี้ในระยะสั้น VECM จะทำการปรับแก้ไขความเบี่ยงเบนในระยะสั้นเพื่อกลับไปสู่ความสมดุลในระยะยาว โดยพิจารณาการปรับเปลี่ยนทั้งในระยะสั้นและระยะยาว ตัวอย่างเช่น ในเศรษฐศาสตร์ ตัวแปรอย่างอัตราดอกเบี้ยและอัตราเงินเฟ้อมักจะมีความสัมพันธ์แบบร่วมบูรณาการ และ VECM จะช่วยอธิบายกระบวนการปรับสมดุลเมื่อมีการเบี่ยงเบนจากความสมดุลในระยะยาว



ข้อสรุป

โมเดล ARIMA เป็นเครื่องมือที่มีความยืดหยุ่นและทรงพลังสำหรับการพยากรณ์อนุกรมเวลา โดยสามารถจำลองแนวโน้ม (trend) วัฏจักร (cycle) และความผิดพลาดแบบสุ่ม (random error) ได้อย่างมีประสิทธิภาพ จึงเป็นตัวเลือกที่มีคุณค่าในการพยากรณ์ในหลากหลายสาขา เช่น การเงิน ค้าปลีก และพลังงาน

ความสามารถของ ARIMA ในการจัดการข้อมูลที่ไม่อยู่ในภาวะนิ่ง (non-stationary) ผ่านกระบวนการหาความแตกต่าง (differencing) และการปรับเอฟเฟกต์ของการหน่วงเวลา (lag) และค่าเฉลี่ยเคลื่อนที่ (moving average) ทำให้สามารถสร้างการพยากรณ์ระยะสั้นที่แม่นยำและแข็งแกร่งได้ อย่างไรก็ตาม ARIMA ต้องการให้ข้อมูลมีความนิ่ง (stationary) และถูกจำกัดให้ใช้ได้กับอนุกรมเวลาที่มีเพียงตัวแปรเดียว (univariate forecasting)

ข้อจำกัดเหล่านี้สามารถแก้ไขได้ด้วยการขยาย ARIMA เช่น SARIMA และ SARIMAX ซึ่งช่วยเพิ่มความสามารถในการจัดการข้อมูลที่มีความผันผวนตามฤดูกาลและปัจจัยภายนอก ด้วยการเข้าใจและเชี่ยวชาญในกระบวนการ ARIMA นักธุรกิจและนักวิเคราะห์สามารถใช้ข้อมูลเพื่อขับเคลื่อนการตัดสินใจ ลดความเสี่ยง ปรับปรุงประสิทธิภาพการดำเนินงาน และเพิ่มผลลัพธ์ทางการเงินได้อย่างมีประสิทธิภาพ

ดู 15 ครั้ง0 ความคิดเห็น

โพสต์ล่าสุด

ดูทั้งหมด

Comments


bottom of page