การสร้างพอร์ตการลงทุนแบบ Factor Model
- Nuthdanai Wangratham
- 2 เม.ย.
- ยาว 3 นาที
"ไม่จำเป็นต้องทำนายอนาคต แค่เดินตามรอยเท้าของปัจจัย ที่เคยพิสูจน์ตัวเองมาแล้ว อย่างมีระบบ"— Cliff Asness
"Smart beta isn't smarter — แค่เป็นการทำสิ่งเก่าๆ อย่างเป็นระบบ — Financial Times Paraphrase
ในบทความก่อนหน้าเราพูดถึงที่มาที่ไปและแนวคิดเบื่องหลังของ Factor Model นั้นคือ Arbitrage Pricing Theory ถึงตรงนี้ทุกคนน่าจะเข้าใจแนวคิดข้อจำกัดของ Factor Model แล้วมาถึงบทความนี้เราจะมาลงลึกถึงการสร้างพอร์ตการลงทุนเชิงปัจจัย
คำคมข้างบนเป็นสิ่งที่สื่อถึง Factor Model ได้ดีมาก Factor Model ไม่ใช้สิ่งมหัจรรย์ใด ๆ มันน่าเบื่อเรียบง่าย แต่มีระบบ การสร้างแบบจำลองเชิงปัจจัยอาจไม่ใช่อะไรที่ยากเกินไปนัก ผมเคยโยนหนังสือให้เด็กฝึกงานที่อยู่มหาวิทยาลัยปีหนึ่ง ทำ เพื่อตัวเองจะได้สามารถไปทำงานสายได้ แต่การได้พอร์ตการลงทุนเชิงปัจจัยที่สามารถสร้างผลตอบแทนเกินกว่าปกติได้ อาจจะยังเป็นเรื่องที่ซับซ้อนกว่านั้น (แม้น้องคนนั้นจะสามารถสร้าง Factor ที่มี Alpha ได้ก็ตาม เพราะปัจจัยที่เลือกผ่านการเทสมาก่อนที่น้องเขาจะเข้ามาฝึกงาน)
การสร้าง Factor Portfolio
ขั้นตอนการสร้าง Factor Portfolio มีเพียง 3 ขั้นตอน
ทดสอบสมมุติฐาน
เลือกหุ้นตาม Factor
การกำหนดสัดส่วนของ
ในแต่ละขั้นตอนมีรายละเอียดเล็กน้อยและในบางขั้นตอนมีทางเลือกให้เราได้เลือกในบทความนี้เราจะอธิบายภาพกว้างวิธีการเบื้องต้นแต่หากท่านผู้อ่านต้องการสร้าง Factor Portfolio ที่ต้องไปใช้ในการลงทุนจริง ๆ ยังมีหน้าที่ศึกษาทำความเข้าใจวิธีการที่เลือกข้อจำกัดเพื่อให้สามารถใช้งาน Factor Portfolio ได้อย่างมีประสิทธิภาพ
ทดสอบสมมุติฐาน
แม้ผมไม่รวมขั้นตอนการเลือกปัจจัยที่คิดว่ามีผและการจัดการข้อมูลมาอยู่ในนี้เพราะผมคิดว่ามันเป็นเชิงปฏิบัติและมีรายละเอียดกับข้อมูลค่อนข้างมากอาจทำให้เสียเวลาใจความสำคัญ(ไว้ทำเป็นคอร์สมาแทนแล้วกัน) แต่ก็ควรเข้าใจถึงการเลือกปัจจัยโดยมีเหตุผลทางเศรษฐสาตร์ หรือถ้าเราใช้หลักการ Data Mining ควรระวังผลลัพธ์ให้ดีซึ่งเราจะอภิปรายเรื่องนี้ในตอนท้ายอีกครั้ง
การอนุมานทางสถิติ คือการเอาข้อมูลจากกลุ่มตัวอย่างเล็กๆ มาช่วยทำนายหรือสรุปเกี่ยวกับกลุ่มใหญ่ทั้งหมด ซึ่งโดยทั่วไปเราจะแบ่งออกเป็น 2 ส่วนหลักๆ คือ การประมาณค่า และ การทดสอบสมมติฐาน เราจะโฟกัสบน การทดสอบสมมติฐาน การทดสอบสมมติฐาน (hypothesis testing) คือกรอบความคิดที่ใช้ "ทดสอบ" สิ่งที่เราเชื่อว่าเป็นอย่างที่เราคิดว่าจริงไหมนั้นคือ ปัจจัย(Factor) ที่เราเลือกมีผลต่อผลตอบแทนในอนาคตจริงไหม
อย่างไรก็ตาม สิ่งสำคัญที่ต้องเข้าใจไว้คือ การทดสอบทางสถิติไม่ได้ให้ความแน่นอนแบบ 100% แม้คุณจะได้ผลว่า "เชื่อมั่นในสมมติฐาน" ก็ไม่ได้แปลว่ามันจริงแน่นอน มันแค่บอกว่า "โอกาสที่คุณจะผิดพลาดอยู่ที่เท่าไร" เท่านั้นเอง
เราต้องเริ่มต้นจาก null hypothesis(H0) คือกรณีพื้นฐาน หรือ "สถานะเดิม" ที่สะท้อนความเข้าใจโดยทั่วไปในปัจจุบันเกี่ยวกับโลกในขณะที่ สมมติฐานทางเลือก (alternative hypothesis) คือสิ่งที่เรากำลังทดสอบว่าจริงหรือไม่ต่างหาก เช่นอย่างที่ Fama ตั้งสมมุติฐานว่า หุ้นขนาดเล็กมีผลตอบแทนมากกว่าขนาดใหญ่ หุ้นที่ผลตอบแทนก่อนหน้าดีจะให้ผลตอบแทนที่ดีกว่า นอกจากนั้น สมมติฐานต้องไม่คลุมเครือ เพราะถ้าไม่ชัดเจน แล้วจะทดสอบมันได้อย่างไร? ตัวอย่างเช่น
"การเทรดตามโมเมนตัมเป็นวิธีที่ดีในการทำเงิน"
ฟังดูดี แต่ทดสอบไม่ได้เลย "ดี" หมายถึงอะไร? ดีแค่ไหน? วัดจากอะไร?แล้วเรากำลังพูดถึงกลยุทธ์โมเมนตัมแบบไหนกันแน่? สมมติฐานควร เฉพาะเจาะจง จนสามารถบอกได้ทันทีว่าจะใช้การทดสอบแบบใดพูดให้ชัด
แม้การทดสอบสมมุติฐานโดยทั่วไปเราจะใช้ค่า P Value และดูความเชื่อมั่น ว่าอยู่ในระดับที่เรารับสมมุตฐานนั้นได้หรือไม่ แต่ในทางการเงินเราอาจต้องทดสอบความเป็นเหตุเป็นผล (causality)
เมื่อทำการทดสอบสมมติฐาน (hypothesis test) คุณสามารถใช้ค่า p-value เพื่อตัดสินผลลัพธ์ได้ ค่า p-value คือระดับนัยสำคัญขั้นต่ำที่คุณสามารถใช้ในการปฏิเสธสมมติฐานศูนย์ (null hypothesis) ได้ หลายคนมักตีความ p-value ว่าเป็น “ความน่าจะเป็นที่สมมติฐานศูนย์จะไม่เป็นจริง” ซึ่งความเข้าใจนี้คลาดเคลื่อน
ค่า p-value จะมีความหมายก็ต่อเมื่อเปรียบเทียบกับระดับนัยสำคัญ (significance level) เท่านั้น ถ้า p-value น้อยกว่าค่า α\alphaα เราจะปฏิเสธสมมติฐานศูนย์ และในทางกลับกัน ค่า p-value ที่ต่ำกว่าไม่ได้หมายความว่า “มีนัยสำคัญทางสถิติมากขึ้น” ผลลัพธ์ทางสถิติหลายอย่างจะคำนวณ p-value ให้อัตโนมัติ แต่คุณก็สามารถคำนวณมันด้วยตนเองได้เช่นกัน ซึ่งขึ้นอยู่กับประเภทของการทดสอบสมมติฐาน และ CDF (พูดถึงไว้ใน บทเรียนเรื่องตัวแปรสุ่ม) ของการแจกแจงที่คุณใช้งาน
หากต้องการคำนวณ p-value ด้วยตนเอง ให้ทำดังนี้:
ในการทดสอบสมมติฐานแบบ "น้อยกว่าหรือเท่ากับ" ค่า p-value คือ (1−CDF(∣Test Statistic∣)
ในการทดสอบสมมติฐานแบบ "มากกว่าหรือเท่ากับ" ค่า p-value คือCDF(Test Statistic)
ในการทดสอบสมมติฐานแบบ "ไม่เท่ากัน" ค่า p-value คือ 2 x (1−CDF(∣Test Statistic∣)
ค่าระดับนัยสำคัญ (significance values) เชื่อมโยงกับช่วงความเชื่อมั่น (confidence intervals) ได้อย่างลงตัว ซึ่งจะมีอธิบายอย่างละเอียดใน บทเรียนเรื่องช่วงความเชื่อมั่น

เรายังต้องตรวจสอบให้แน่ใจว่า ข้อมูลที่ใช้ในการทดสอบไม่รวมค่าที่เราไม่สามารถรู้ได้ในช่วงเวลาที่เรากำลังทดสอบอยู่ (แม้ปัญหานี้จะเกิดขึ้นบ่อยกว่าเมื่อเปรียบเทียบหลายสิ่งด้วยการทดสอบสมมติฐาน)
การสร้าง Factor Portfolio
หลังจากที่เราสามารถค้นหาปัจจัยที่ส่งผลต่อผลตอบแทนของสินทรัพย์ที่เราสนใจได้แล้วเราสามารคัดกรองหลักทรัพย์เพื่อสร้างพอร์ตการลงทุนตามปัจจัยที่เราสนใจต่อไป แต่การสร้าง Factor Portfolio ก็มีหลากหลายวิธี
Simple Factor Portfolio
วิธีการแรกเราจะไปดูต้นตำหรับของแบบจำลองเชิงปัจจัยและวิธีการที่ใช้กันแพร่หลายที่สุด นั้นคือวิธีของ Fama และ French (1992) ใช้ในการศึกษาของพวกเขา แนวคิดนั้นเรียบง่าย โดยกำหนดจุดใดจุดหนึ่งของเวลาเราจะทำขั้นตอนดังนี้
จัดอันดับบริษัทตามเกณฑ์ใดเกณฑ์หนึ่ง (เช่น ขนาดของบริษัท อัตราส่วน book-to-market)
จากนั้นจัดกลุ่มหุ้นออกเป็นพอร์ตโฟลิโอจำนวน 𝐽 ≥ 2 กลุ่ม (เช่น กลุ่มที่มีลักษณะใกล้เคียงกัน) โดยให้แต่ละกลุ่มมีจำนวนหุ้นเท่ากันตามลำดับอันดับที่จัดไว้ (โดยทั่วไป 𝐽 = 2, 3, 5 หรือ 10 โดยใช้ค่ากลาง tercile quintile หรือ decile ตามเกณฑ์ที่เลือก)
กำหนดน้ำหนักของหุ้นภายในพอร์ตอาจเป็นแบบถ่วงน้ำหนักเท่ากัน หรือแบบถ่วงน้ำหนักตามมูลค่าตลาดก็ได้
ในวันอนาคต(โดยปกติจะใช้หนึ่งเดือนถัดไป) รายงานผลตอบแทนของแต่ละพอร์ต แล้วทำขั้นตอนทั้งหมดซ้ำไปเรื่อย ๆ จนกว่าจะครบระยะเวลาที่ต้องการศึกษาทั้งหมด
ผลลัพธ์ที่ได้คืออนุกรมเวลา (time series) ของผลตอบแทนพอร์ต 𝑟𝑗𝑡 สำหรับแต่ละกลุ่ม 𝑗 หากผลการทดสอบ t-test ระหว่างกลุ่มแรก (𝑗 = 1) และกลุ่มสุดท้าย (𝑗 = 𝐽) แสดงให้เห็นความแตกต่างของผลตอบแทนเฉลี่ยอย่างมีนัยสำคัญ ก็ถือว่าพบความผิดปกติ (anomaly)
นอกจากนี้เรายังสามารถจัดกลุ่มสินทรัพย์ตามหลายตัวแปรพร้อมกันได้ ไม่จำกัดเพียงแค่ลักษณะเดียวเช่นในงานต้นฉบับของ Fama และ French (1992) ได้ใช้ทั้งขนาดของบริษัทและอัตราส่วน book-to-market โดยแบ่งแต่ละลักษณะออกเป็น 10 กลุ่ม ทำให้ได้พอร์ตทั้งหมด 100 พอร์ตหากไม่ติดข้อจำกัดด้านข้อมูล ก็ไม่มีขีดจำกัดว่าต้องจำกัดไว้กี่ตัวแปร
Fama-Macbeth regressions
อีกหนึ่งวิธีการสร้าง Factor Portfolio คือวิธี Fama และ MacBeth (1973) โดยการใช้วิธี regression
เพื่อหาผลตอบแทนส่วนเกินจากความเสี่ยง(risk premia) ขั้นตอนแรกเป็นการประมาณความสัมพันธ์ โดยการรันรีเกรสชันแบบรายหุ้นจากชุดข้อมูล time series ที่สอดคล้องกัน ค่าประมาณที่ได้ β จะถูกนำไปใช้ในชุดรีเกรสชันขั้นที่สอง:

ซึ่งจะถูกรันแบบรายวันในครอสเซกชันของสินทรัพย์ ตามทฤษฎีแล้วค่าเบต้า(β) จะเป็นส่วนชดเชยความเสี่ยงของปัจจัยจะประมาณค่าพรีเมียของแฟกเตอร์ k ณ เวลา t ภายใต้สมมติฐานของการแจกแจงบางประการของ ε สามารถทำการทดสอบทางสถิติเพื่อตรวจสอบว่าค่าพรีเมียเหล่านี้มีนัยสำคัญหรือไม่ ค่าสถิติที่ใช้วัดค่าเฉลี่ยพรีเมียเมื่อรวมเวลาคือ

การสร้าง Factor Portfolio จาก Fama-Macbeth regressions นักลงทุนสามารถเลือกระหว่างพอร์ตโฟลิโอปัจจัยเดียว ซึ่งมุ่งเน้นไปที่การเพิ่มการเปิดรับปัจจัยใดปัจจัยหนึ่งให้สูงสุด หรือพอร์ตโฟลิโอหลายปัจจัย ซึ่งมีเป้าหมายเพื่อจับส่วนต่างจากหลายปัจจัยพร้อมกัน โดยทำคล้ายๆ กับวิธีแรกโดยเราเรียงลำดับหุ้นตามค่าเบต้าของปัจจัยนั้น แล้วแบ่งกลุ่มตามเงื่อนไขที่เรากำหนด
การคาดการณ์ผลตอบแทน
ดังที่กล่าวไว้ข้างต้น การสร้างแบบจำลองเชิงปัจจัยสามารถใช้เพื่อคาดการณ์ผลตอบแทนในอนาคตโดยอิงจากปัจจัยพื้นฐานในปัจจุบันได้เช่นกัน นอกจากนี้ ยังสามารถใช้เพื่อระบุว่าสินทรัพย์อาจมีราคาผิดพลาดเมื่อใด เพื่อที่จะเก็งกำไรจากส่วนต่าง อ่านได้จาก CAPM: The Capital Asset Pricing Model และ Arbitrage Pricing Theory
การสร้างแบบจำลองผลตอบแทนในอนาคตทำได้โดยการชดเชยผลตอบแทนในการถดถอย ดังนั้นแทนที่จะคาดการณ์ผลตอบแทนในปัจจุบัน คุณกำลังคาดการณ์ผลตอบแทนในอนาคต เมื่อคุณมีแบบจำลองการคาดการณ์ วิธีที่เป็นมาตรฐานที่สุดในการสร้างกลยุทธ์คือการพยายามใช้วิธีการซื้อหุ้นที่มีลำดับสูง(long) และขายหุ้นที่อยู่ในลำดับตำ่(short)
Market Neutral portfolio
เมื่อเราพิจารณาแล้วว่าเรามีความเสี่ยงต่อปัจจัยหนึ่ง เราอาจต้องการหลีกเลี่ยงการพึ่งพาผลการดำเนินงานของปัจจัยนั้นโดยการใช้กลยุทธ์ป้องกันความเสี่ยง (hedge) ผมจะมาเขียนบทความแยกเรื่องของการสร้าง Market Neutral portfolio หรือ Beta Hedging แต่ถ้าคุณสนใจลองอ่านได้ที่ https://github.com/nutdnuy/Market-Neutral-portfolio/blob/main/mkt_neutral.ipynb
แนวคิดหลักของ Market Neutral portfolio คือการนำความเสี่ยงที่กระแสผลตอบแทนของคุณมีต่อปัจจัยหนึ่ง และขายชอร์ต (short) มูลค่าตามสัดส่วนนั้น ดังนั้น หากมูลค่าพอร์ตโฟลิโอทั้งหมดของคุณคือ V และความเสี่ยงที่คุณคำนวณได้ต่อกระแสผลตอบแทนของปัจจัยหนึ่งคือ β คุณจะขายชอร์ตมูลค่า βV ของกระแสผลตอบแทนนั้น
ส่งท้าย
ทั้งหมดนี้คือการปูพื้นฐานแนวคิดการสร้างแบบจำลองเชิงปัจจัยในเชิงสถิติ ตั้งแต่กระบวนการทดสอบสมมติฐานเบื้องต้น ไปจนถึงการประยุกต์ใช้จริงในการสร้าง Factor Portfolio ไม่ว่าจะเป็นวิธีแบบ Simple หรือผ่านการใช้ Fama-MacBeth Regressions โดยเน้นย้ำว่าการสร้างแบบจำลองไม่ใช่เพียงแค่เรื่องของตัวเลขและสูตรทางคณิตศาสตร์ แต่ต้องตั้งอยู่บนสมมติฐานที่มีเหตุผลรองรับ ไม่ว่าจะมาจากหลักเศรษฐศาสตร์หรือการระมัดระวังผลจากการขุดค้นข้อมูล (Data Mining)
สุดท้าย แม้แบบจำลองเชิงปัจจัยจะช่วยให้เรามีเครื่องมือในการเข้าใจและคาดการณ์พฤติกรรมของตลาดได้ดีขึ้น แต่มันก็ไม่ได้การันตีผลลัพธ์ใด ๆ ในโลกแห่งความจริง ความไม่แน่นอนและความเสี่ยงยังคงมีอยู่เสมอ สิ่งสำคัญคือการมีกรอบความคิดที่ถูกต้องในการตั้งสมมติฐาน การออกแบบวิธีทดสอบอย่างเหมาะสม และการตีความผลลัพธ์ด้วยความระมัดระวัง
ref:
อนุกรมพิทานศัพท์ (Glossary)
Fama-MacBeth Regressions เทคนิคการวิเคราะห์เชิงปริมาณที่ใช้ประเมินค่าพรีเมียของปัจจัย (Factor Risk Premia) โดยแบ่งเป็นสองขั้นตอน: (1) รีเกรสชันแบบ Time-Series เพื่อหาค่าเบต้าของหุ้นแต่ละตัว และ (2) รีเกรสชันแบบ Cross-Sectional เพื่อประเมินค่าพรีเมียของปัจจัยในแต่ละช่วงเวลา นิยมใช้ในงานวิจัย Quant และ Asset Pricing
Factor Portfolio พอร์ตการลงทุนที่สร้างขึ้นโดยคัดเลือกสินทรัพย์ตามลักษณะของปัจจัย (Factors) เช่น ขนาดบริษัท มูลค่าทางบัญชี โมเมนตัม ฯลฯ โดยมีเป้าหมายเพื่อให้พอร์ตมีการเปิดรับต่อปัจจัยเหล่านั้นอย่างมีนัยสำคัญ
Null Hypothesis (H₀)สมมติฐานพื้นฐานในเชิงสถิติที่ถือเป็น "สถานะเดิม" หรือ "ไม่มีผลกระทบ" ใช้เป็นจุดตั้งต้นในการทดสอบสมมติฐาน เช่น ปัจจัยที่เลือก “ไม่มีผลต่อผลตอบแทน”
Alternative Hypothesis (H₁)สมมติฐานทางเลือกที่เราต้องการทดสอบว่าเป็นจริงหรือไม่ เช่น ปัจจัยหนึ่งส่งผลต่อผลตอบแทนของสินทรัพย์
p-valueค่าความน่าจะเป็นที่แสดงว่า หากสมมติฐานศูนย์เป็นจริง ความน่าจะเป็นที่จะได้ผลลัพธ์ที่สังเกตได้ (หรือรุนแรงกว่านั้น) คือเท่าใด ถ้า p-value ต่ำกว่าระดับนัยสำคัญ (เช่น 0.05) จะพิจารณาว่าผลมีนัยสำคัญ
Significance Level (α)ค่าระดับนัยสำคัญทางสถิติที่กำหนดไว้ล่วงหน้า เช่น 0.01, 0.05 หรือ 0.1 ใช้เป็นเกณฑ์ในการตัดสินใจว่าจะปฏิเสธสมมติฐานศูนย์หรือไม่
Simple Factor Portfolioวิธีการสร้างพอร์ตปัจจัยแบบง่าย เช่น การจัดกลุ่มหุ้นตามค่า Book-to-Market หรือ Size แล้วสร้างพอร์ตที่เปิดรับต่อคุณลักษณะนั้น เช่น วิธีของ Fama-French ที่จัดหุ้นเป็นกลุ่มตามตัวแปร แล้ววัดความแตกต่างของผลตอบแทนระหว่างกลุ่ม
Market Neutral Portfolioพอร์ตที่ถูกออกแบบให้ผลตอบแทน "ไม่ขึ้นกับตลาด" โดยใช้กลยุทธ์ Long-Short เพื่อหักล้างความเคลื่อนไหวจากตลาดรวม เช่น การ Long หุ้นคุณค่า และ Short หุ้นเติบโต ในสัดส่วนที่ความเสี่ยงตลาด (beta) หักล้างกัน
Risk Premiumผลตอบแทนส่วนเพิ่มที่นักลงทุนต้องการเพื่อชดเชยความเสี่ยง เช่น หุ้นที่มีความเสี่ยงสูงจะต้องให้ผลตอบแทนมากกว่าหุ้นที่มีความเสี่ยงต่ำ
Factor Investingแนวทางการลงทุนที่อิงกับปัจจัยพื้นฐานหรือเชิงพฤติกรรมที่ได้รับการพิสูจน์แล้วว่าให้ผลตอบแทนส่วนเกิน เช่น Value, Size, Momentum, Profitability เป็นต้น
Anomalyความผิดปกติในตลาดที่ขัดกับทฤษฎีดั้งเดิม เช่น CAPM ไม่สามารถอธิบายได้ว่าเหตุใดหุ้นเล็กถึงให้ผลตอบแทนสูงกว่า
Overfittingการที่โมเดลเรียนรู้ "มากเกินไป" จากข้อมูลในอดีตจนไม่สามารถใช้งานกับข้อมูลใหม่ได้ดี มักเกิดเมื่อใช้ตัวแปรมากเกินไป หรือโมเดลซับซ้อนเกินจำเป็น
Look-ahead Biasความลำเอียงที่เกิดขึ้นเมื่อข้อมูลในอนาคตถูกนำมาใช้ในโมเดลที่ควรจำกัดเฉพาะข้อมูลในอดีต เช่น ใช้กำไรปีหน้ามาจัดอันดับหุ้นในปัจจุบัน
Data Mining Biasการขุดหาผลลัพธ์จากข้อมูลจำนวนมากโดยไม่มีทฤษฎีหรือเหตุผลรองรับ ทำให้ผลลัพธ์ที่ดู "มีนัยสำคัญ" มักเกิดจากความบังเอิญ
Comments