ระบบการเงินแทบจะเป็นแบบสุ่ม เคลื่อนที่ดูเหมือนไม่มีทิศทาง แล้วเราจะศึกษากลไกของระบบการเงินหรือตลาดตลาดการเงินอย่างไร?
แบบจำลอง Hidden Markov Models เป็นแบบจำลองหนึ่งที่ใช้ในการศึกษาระบบที่มีการสุ่มอย่างมาก ตั้งแต่โมเดลภาษาขนาดใหญ่ ภูมิอากาศ หรือแม้กระทั้งตลาดการเงิน
Hidden Markov Models คืออะไร?
โมเดล HMM สามารถมองได้ว่าเป็นกราฟ โดยที่โหนด (nodes) แต่ละโหนดแทนการแจกแจงความน่าจะเป็น (probability distribution) ของสถานะ แล edges ที่แสดงถึงความน่าจะเป็นของการเปลี่ยนสถานะ (transition) จากโหนดหนึ่งไปยังอีกโหนดหนึ่ง เมื่อรวมองค์ประกอบทั้งสองเข้าด้วยกัน โมเดล HMM จึงสามารถใช้คำนวณความน่าจะเป็นของสถานะ ได้ เมื่อกำหนดลำดับอินพุต

Markov Chain ?
Markov Chain เป็นโมเดลทางสถิติที่แสดงถึงลำดับของเหตุการณ์ที่อาจเกิดขึ้น โดยที่ความน่าจะเป็นของเหตุการณ์ถัดไปจะขึ้นอยู่กับสถานะปัจจุบันเท่านั้น กล่าวอีกนัยหนึ่ง Markov Chain ตั้งสมมติฐานว่า อนาคตจะไม่ขึ้นอยู่กับอดีต แต่ขึ้นอยู่กับปัจจุบันเท่านั้น
ตัวอย่างเช่น ในการพยากรณ์อากาศ หากวันนี้อากาศแจ่มใส โซ่มาร์คอฟจะถือว่าพรุ่งนี้ขึ้นอยู่กับสภาพอากาศในวันนี้เท่านั้น โดยไม่สนใจข้อมูลย้อนหลัง ซึ่งสามารถแสดงทางคณิตศาสตร์ได้ดังนี้:

องค์ประกอบของโซ่มาร์คอฟ ได้แก่:
สถานะ (States - Q): สถานะที่เป็นไปได้ เช่น แจ่มใส ฝนตก หนาว
ความน่าจะเป็นการเปลี่ยนสถานะ (Transition Probabilities - A): ความน่าจะเป็นของการเปลี่ยนจากสถานะหนึ่งไปยังอีกสถานะหนึ่ง
ความน่าจะเป็นเริ่มต้น (Initial Probabilities - π): ความน่าจะเป็นของการเริ่มต้นที่สถานะใดสถานะหนึ่ง
HMMs มีข้อดีอย่างไร?
โซ่มาร์คอฟแบบปกติใช้กับสถานะที่สามารถสังเกตเห็นได้โดยตรง แต่ในหลายกรณี สถานะที่แท้จริงนั้นไม่สามารถสังเกตได้โดยตรง ซึ่งนำไปสู่การพัฒนา โมเดลมาร์คอฟแบบแฝง (Hidden Markov Models - HMMs)
HMMs ใช้เพื่อสร้างแบบจำลองที่มีสถานะแฝง หมายความว่าเราสามารถสังเกตผลลัพธ์บางอย่างได้ แต่ไม่สามารถเห็นสถานะที่แท้จริงที่ทำให้เกิดผลลัพธ์เหล่านั้นได้ ตัวอย่างเช่น ในการรู้จำเสียงพูด เราสามารถสังเกตสัญญาณเสียง แต่ไม่สามารถเห็นโฟนีม (phoneme) ที่สร้างเสียงนั้นโดยตรง
องค์ประกอบหลักของ HMMs ได้แก่:
สถานะ (States - Q): สถานะแฝง เช่น โฟนีมในเสียงพูด หรือแท็กชนิดของคำในข้อความ
ความน่าจะเป็นการเปลี่ยนสถานะ (Transition Probabilities - A): ความน่าจะเป็นของการเปลี่ยนจากสถานะแฝงหนึ่งไปยังอีกสถานะหนึ่ง
ความน่าจะเป็นของการสังเกต (Observation Probabilities - B): ความน่าจะเป็นของการเกิดผลลัพธ์ที่กำหนดเมื่ออยู่ในสถานะแฝง
ความน่าจะเป็นเริ่มต้น (Initial Probabilities - π): ความน่าจะเป็นของการเริ่มต้นที่สถานะหนึ่ง
Baum-Welch Algorithm
Baum–Welch Algorithm ถูกสร้างขึ้นโดย เจมส์ แอ็กซ์ หนึ่งในผู้ที่ร่วมก่อตั้ง Renaissance Technology ถึงต้องนี้คุณเห็นจุดเชื่อมโยงไหมแหละครับ เจมส์ แอ็กซ์ มองว่า ตลาดเป็น Hidden Markov Process ขนาดใหญ่
อัลกอริทึมโบม-เวลช์ (Baum-Welch Algorithm) เป็นวิธีการเรียนรู้พารามิเตอร์ของ Hidden Markov Model (HMM) แบบ unsupervised learning ซึ่งใช้เพื่อประมาณค่าพารามิเตอร์การเปลี่ยนสถานะ (transition probabilities) และค่าการสังเกต (emission probabilities) ของโมเดลจากชุดข้อมูลการสังเกตที่ไม่ทราบสถานะที่แท้จริงของมัน
อัลกอริทึมนี้เป็นกรณีพิเศษของ Expectation-Maximization (EM) Algorithm ที่ทำงานโดยการคำนวณความน่าจะเป็นร่วมของสถานะแฝงต่างๆ แล้วอัปเดตค่าพารามิเตอร์ของโมเดลแบบวนซ้ำ (iterative estimation) เพื่อเพิ่มความน่าจะเป็นของข้อมูลที่สังเกตได้
บทสรุป
โมเดลมาร์คอฟแบบแฝง (HMMs) เป็นเครื่องมือที่มีประสิทธิภาพสำหรับการสร้างแบบจำลองข้อมูลตามลำดับ โดยสามารถประยุกต์ใช้กับข้อมูลที่มีสถานะแฝงซึ่งไม่สามารถสังเกตได้โดยตรง ด้วยอัลกอริทึมหลัก เช่น Forward, Viterbi และ Baum-Welch HMMs สามารถช่วยให้เกิดความเข้าใจและการทำนายข้อมูลตามลำดับได้อย่างแม่นยำ
HMMs ถูกนำไปใช้งานอย่างกว้างขวางในหลายสาขา เช่น:
การรู้จำเสียงพูด: เพื่อจับคู่คลื่นเสียงกับคำพูดหรือพยางค์
การประมวลผลภาษาธรรมชาติ: การแท็กชนิดของคำ และการจดจำชื่อเฉพาะ
ชีวสารสนเทศศาสตร์ (Bioinformatics): การวิเคราะห์ลำดับดีเอ็นเอและโปรตีน
การเงิน: การสร้างแบบจำลองและการพยากรณ์แนวโน้มของตลาดหุ้น
หุ่นยนต์: การสรุปสถานะของระบบตามข้อมูลจากเซ็นเซอร์
ref :
コメント