Machine learning สร้างผลกระทบที่ยิ่งใหญ่ไปทุกอุตสาหกรรมไม่เว้นแม้กระทั้งอุตสาหกรรมจัดการลงทุน เราสามารถนำ Machine learning มาประยุกต์ใช้รวมถึงบทบาทจะมีความสำคัญเพิ่มขึ้น มันจะสร้างความสามารถในการแข่งขันสำหรับผู้ที่นำ ML มาใช้ในทางกลับกันผู้ที่ต่อต้านและไม่เรียนรู้ถึงศักยภาพของ ML มีแนวโน้มจะร่วมชะตากรรมกับ Kodak
ML กับการลงทุน
ปัญหาทางการเงินเป็นความท้าทายอย่างยิ่งเนื่องจากระบบเศรษฐกิจแสดงระดับความซับซ้อนจนทำให้เข้าใจได้ยากมาก แต่การที่พัฒนาการของคอมพิวเตอร์ทำให้วิธีการในการวิเคราะห์ทางสถิติเปลี่ยนไป วิธีการที่ซับซ้อนอย่าง cross-validation, ensemble estimators, regularization, bootstrapping, หรือ Monte Carlo ทำให้ได้รับผลลัพธ์ที่ดีกว่าการวิเคราะห์การลงทุนแบบดั่งเดิม
แต่เดี๋ยวก่อนเราไม่ใช่จะปฏิเสธทฤษฎีทางการเงินทั้งหมดแล้วหมกหมุ่นกับ ML หรือมั่วแต่ใช้ backtest กลยุทธ์การลงทุนในอดีตโดยไม่สนใจอะไร แต่จุดมุ่งหมายของเราคือเราจะใช้ ML เพื่อสร้างทฤษฎีทางการเงินที่ดีขึ้น เพราะว่าทฤษฎีสามารถบอกถึงกลไกของเหตุและผลของสิ่งที่เกิดขึ้นมันไม่มีประโยชน์อะไรเลยหากคุณสร้างกลยุทธ์การลงทุนที่ดีแต่ไม่สามารถอธิบายถึงหลักการให้ใครฟังได้เลย
backtesting ไม่ใช่เครื่องมือวิจัย backtesting เป็นเพียงเครื่องมือที่จะทดสอบกลยุทธ์กับข้อมูลในอดีต(เราไม่มีข้อมูลในอนาคตตอนนี้นิ) กลยุทธ์การลงทุนต้องได้รับการสนับสนุนจากทฤษฏีเท่านั้น
เราสามารถใช้ ML เพื่อค้นหาตัวแปรที่ซ่อนอยู่ซึ่งเกี่ยวข้องกับปรากฏการณ์ที่ซับซ้อนแล้วเราก็สามารถกำหนดทฤษฎีที่เชื่อมโยงส่วนผสมเหล่านี้ผ่านโครงสร้างในระบบสมการที่ตั้งสมมติฐานเกี่ยวกับกลไกของเหตุและผลโดยเฉพาะ เมื่อทฤษฎีได้รับการทดสอบแล้ว เราสามารถนำทฤษฎีไปใช้ได้เมื่อทฤษฎีถูกค้นพบแล้ว อัลกอริทึม ML จะไม่มีบทบาทในการตัดสินใจ การใช้ ML ในด้านการเงินอย่างชาญฉลาดที่สุดคือการค้นพบทฤษฎีต่างๆ คุณสามารถใช้ ML เพื่อคาดการณ์ทางการเงินได้สำเร็จ อย่างไรก็ตาม นั่นไม่ใช่การใช้เทคโนโลยีนี้ในเชิงวิทยาศาสตร์ที่ดีที่สุด (โดยเฉพาะอย่างยิ่งหากเป้าหมายของคุณคือการพัฒนากลยุทธ์การลงทุน
Existence:ML ถูกนำมาใช้เพื่อประเมินความน่าเชื่อถือของทฤษฎีในสาขาวิทยาศาสตร์ทั้งหมด แม้แต่นอกเหนือไปจากวิทยาศาสตร์เชิงประจักษ์ โดยเฉพาะอย่างยิ่ง อัลกอริทึม ML ช่วยให้ค้นพบทางคณิตศาสตร์ อัลกอริธึม ML ไม่สามารถพิสูจน์ทฤษฎีบทได้ แต่สามารถชี้ไปที่การมีอยู่ของทฤษฎีบทที่ยังไม่ถูกค้นพบ ซึ่งสามารถคาดเดาและพิสูจน์ได้ในที่สุด กล่าวอีกนัยหนึ่ง หากสามารถทำนายบางสิ่งได้ ก็มีความหวังว่าจะสามารถเปิดเผยกลไกได้
Importance: อัลกอริทึม ML สามารถหาความสัมพัทธ์ของตัวแปร เพื่อวัตถุประสงค์ในการอธิบายและ/หรือการทำนาย
Causation: ML algorithms สามารถประยุกต์ใช้ในการหาสาเหตุรวมถึงผลกระทบของเหตุการณ์ต่างๆ
Reductionist:เทคนิค ML สามารถปรับขนาดของข้อมูลที่มีหลายมิติและซับซ้อนให้เข้าใจได้ง่ายขึ้นทำให้แยกความแตกต่างนั้นสามารถวิเคราะห์ได้
Retriever:ML ใช้ในการสแกนผ่านข้อมูลขนาดใหญ่เพื่อค้นหารูปแบบที่มนุษย์ไม่รู้จักเช่นการตรวจจับค่าผิดปกติ
Overfitting
Overfitting เกิดได้ 2 ลักษณะ ได้แก่ Overfitting ที่เกิดจากข้อมูลฝึก และ Overfitting ที่เกิดจากข้อมูลทดสอบ
Train Set Overfitting
Train set overfitting เกิดจาก noise ซึ่งเรามี 3 วิธีในการจัดการ
ประเมินข้อผิดพลาดทั่วไปโดยใช้เทคนิคการสุ่มใหม่(cross-validation) และ Monte Carlo
regularization methods ใช้วิธี ที่รวมการคาดคะเนของโมเดลหลาย ๆ แบบเพื่อปรับปรุงประสิทธิภาพโดยรวมของโมเดล เทคนิคเหล่านี้สามารถใช้เพื่อจัดการกับชุดการฝึกมากเกินไป ซึ่งเกิดขึ้นเมื่อแบบจำลองมีความซับซ้อนมากเกินไป และเรียนรู้รายละเอียดและสัญญาณรบกวนในข้อมูลการฝึก ซึ่งนำไปสู่การสรุปข้อมูลใหม่ที่ไม่ดี
Ensemble techniques เป็นเทคนิคที่สามารถใช้เพื่อลด overfitting ในโมเดลแมชชีนเลิร์นนิงโดยการเพิ่มคำลงโทษในฟังก์ชันวัตถุประสงค์ที่โมเดลพยายามปรับให้เหมาะสม เงื่อนไขการลงโทษส่งเสริมให้โมเดลมีน้ำหนักน้อยลง ซึ่งสามารถช่วยป้องกันไม่ให้โมเดลเรียนรู้สัญญาณรบกวนในข้อมูลการฝึก
Test Set Overfitting
นักวิจัยที่ทำการทดสอบทางสถิติหลายครั้งในชุดข้อมูลเดียวกันก็มีแนวโน้มที่จะค้นพบข้อมูลที่ผิดพลาด การใช้การทดสอบเดียวกันกับชุดข้อมูลเดียวกันหลายๆ ครั้ง รับประกันได้ว่าในที่สุดนักวิจัยจะทำการค้นพบที่ผิดพลาด ความลำเอียงในการเลือกนี้มาจากการปรับโมเดลให้ทำงานได้ดีในชุดทดสอบ ไม่ใช่ชุดรถไฟ
อีกตัวอย่างหนึ่งของการ overfitting ชุดทดสอบเกิดขึ้นเมื่อนักวิจัยทดสอบกลยุทธ์ย้อนหลัง และเธอปรับแต่งจนกว่าผลลัพธ์จะบรรลุประสิทธิภาพตามเป้าหมาย วงจร backtest-tweak-backtest นั้นเป็นแบบฝึกหัดที่ไร้ประโยชน์ซึ่งจะจบลงด้วยกลยุทธ์ overfit อย่างหลีกเลี่ยงไม่ได้ (ผลบวกลวง) นักวิจัยควรใช้เวลาของเธอในการสืบสวนว่ากระบวนการวิจัยทำให้เธอเข้าใจผิดในการทดสอบกลยุทธ์ที่ผิดพลาดย้อนหลังได้อย่างไร กล่าวอีกนัยหนึ่ง backtest ที่มีประสิทธิภาพต่ำคือโอกาสในการแก้ไขกระบวนการวิจัย ไม่ใช่โอกาสในการแก้ไขกลยุทธ์การลงทุน
สิ่งที่คนเข้าใจผิดในการใช้ ML ในการลงทุน
ML ทำได้ทุกอย่าง: เรามักได้ยินข้อมูลที่เกินจริงของ ML ทำให้คนส่วนใหญ่เชื่อว่าทำได้ทุกอย่าง ML แต่แท้จริงแล้ว ML ก็มีข้อจำกัดไม่ได้แก้ได้ทุกปัญหาขนาดนั้น
ML Is a Black Box: อีกหนึ่งความเชื่อที่เข้าใจผิดคือ ML เป็นกล่องดำไม่สามารถอธิบายได้ แต่แท้จริงแล้ว ML สามารถให้ข้อมูลเชิงลึกได้มากกว่าวิธีการทางสถิติแบบดั้งเดิม (รวมถึงเศรษฐมิติ) โมเดล ML สามารถตีความได้ผ่านหลายขั้นตอน
ข้อมูลทางการเงินไม่พอต่อการใช้ ML: อัลกอริธึม ML บ้างอันอาจจำเป็นต้องใช้ข้อมูลจำนวนมาก แต่ML จำนวนมากในด้านการเงินไม่ต้องการข้อมูลในอดีตเยอะขนาดนั้น หรือไม่ต้องการเลยเช่น การวิเคราะห์ความเสี่ยง การสร้างพอร์ตโฟลิโอ การตรวจจับค่าผิดปกติ ความสำคัญของคุณลักษณะ
มีข้อมูลรบกวนเยอะ: ความเป็นจริงแล้วข้อมูลทางการเงินมี Noise ต่ำกว่าชุดที่ใช้โดยแอปพลิเคชัน ML อื่นๆ
อนาคตของการวิจัยทางการเงิน
ข้อมูลส่วนใหญ่ในโลกเป็นข้อมูลแบบไม่มีโครงสร้าง เทคนิคเชิงปริมาณแบบดั้งเดิมอาจล้มเหลวในการจับความสัมพันธ์ที่อาจซับซ้อน (เช่น ความไม่เชิงเส้นและการโต้ตอบ) ระหว่างตัวแปร และเทคนิคเหล่านี้มีความละเอียดอ่อนอย่างยิ่งต่อปัญหาหลายกลุ่มเชิงเส้นที่แผ่ซ่านไปทั่วชุดข้อมูลทางการเงิน
บริษัทด้านการลงทุนเชิงปริมาณที่ประสบความสำเร็จมากที่สุดในประวัติศาสตร์พึ่งพา ML เป็นหลัก ไม่ใช่เศรษฐมิติ และปัจจุบันเศรษฐมิติที่มีความโดดเด่นในการศึกษาระดับบัณฑิตศึกษาได้เตรียมนักศึกษาให้พร้อมสำหรับการประกอบอาชีพด้านวิชาการ ไม่ใช่งานในอุตสาหกรรม
นี่ไม่ได้หมายความว่าเศรษฐมิติมีอายุการใช้งานยาวนานกว่า นักวิจัยที่ถูกขอให้ตัดสินใจระหว่างเศรษฐมิติและ ML นั้นถูกนำเสนอด้วยตัวเลือกที่ผิด ML และเศรษฐมิติเสริมซึ่งกันและกัน เพราะมีจุดแข็งที่แตกต่างกัน ตัวอย่างเช่น ML สามารถเป็นประโยชน์อย่างยิ่งในการแนะนำส่วนประกอบของทฤษฎีแก่นักวิจัย และเศรษฐมิติจะเป็นประโยชน์ในการทดสอบทฤษฎีที่มีพื้นฐานมาจากการสังเกตเชิงประจักษ์ ในความเป็นจริง บางครั้งเราอาจต้องการใช้ทั้งสองกระบวนทัศน์พร้อมกัน เช่น ในวิธีกึ่งพารามิเตอร์ ตัวอย่างเช่น การถดถอยอาจรวมตัวแปรอธิบายที่สังเกตได้เข้ากับตัวแปรควบคุมที่สนับสนุนโดยอัลกอริทึม ML
ส่งท้าย
จุดประสงค์ขององค์ประกอบนี้คือเพื่อแนะนำเครื่องมือ ML ที่มีประโยชน์สำหรับการค้นพบทฤษฎีทางเศรษฐศาสตร์และการเงิน กลยุทธ์การลงทุนที่ประสบความสำเร็จคือการนำทฤษฎีทั่วไปไปใช้อย่างเฉพาะเจาะจง กลยุทธ์การลงทุนที่ขาดเหตุผลทางทฤษฎีมักจะเป็นเท็จ ดังนั้น นักวิจัยควรมุ่งความสนใจไปที่การพัฒนาทฤษฎีมากกว่าการทดสอบกลยุทธ์ที่เป็นไปได้ย้อนหลัง ML ไม่ใช่กล่องดำ และไม่จำเป็นต้องเกินพอดี เครื่องมือ ML ช่วยเสริมแทนที่จะแทนที่วิธีการทางสถิติแบบดั้งเดิม จุดแข็งบางประการของ ML ได้แก่ (1) มุ่งเน้นไปที่ความสามารถในการคาดการณ์นอกกลุ่มตัวอย่างมากกว่าการตัดสินผลต่าง ๆ; (2) การใช้วิธีการคำนวณเพื่อหลีกเลี่ยงการพึ่งพาสมมติฐาน (ที่อาจไม่สมจริง) (3) ความสามารถในการ “เรียนรู้” ข้อกำหนดที่ซับซ้อน รวมถึงเอฟเฟกต์การโต้ตอบแบบไม่เชิงเส้น ลำดับชั้น และไม่ต่อเนื่องในพื้นที่มิติสูง และ (4) ความสามารถในการแยกแยะการค้นหาตัวแปรออกจากการค้นหาข้อมูลจำเพาะ ในลักษณะที่แข็งแกร่งต่อ multicollinearity และเอฟเฟกต์การแทนที่อื่น ๆ
Comments