portaldacalheta.pt
  • หลัก
  • กระบวนการและเครื่องมือ
  • การวางแผนและการพยากรณ์
  • การออกแบบ Ui
  • การจัดการโครงการ
แบ็คเอนด์

ข้อมูลเบื้องต้นเกี่ยวกับการเทรดแบบ Deep Learning ในกองทุนป้องกันความเสี่ยง



ในช่วงไม่กี่ปีที่ผ่านมาโครงข่ายประสาทเทียมแบบลึกได้รับความนิยมอย่างมาก สาขาวิทยาศาสตร์คอมพิวเตอร์ที่เกิดขึ้นใหม่นี้ถูกสร้างขึ้นโดยใช้แนวคิดของเครือข่ายประสาททางชีววิทยาและการเรียนรู้เชิงลึกได้กลายเป็นคำที่แพร่หลายในปัจจุบัน

นักวิทยาศาสตร์และวิศวกรด้านการเรียนรู้เชิงลึกพยายามอธิบายรูปแบบต่างๆทางคณิตศาสตร์จากระบบประสาททางชีววิทยา ระบบการเรียนรู้เชิงลึกถูกนำไปใช้กับปัญหาต่างๆเช่นการมองเห็นของคอมพิวเตอร์การรู้จำเสียงการประมวลผลภาษาธรรมชาติการแปลด้วยเครื่องและอื่น ๆ เป็นเรื่องที่น่าสนใจและน่าตื่นเต้นที่ในบางงานการเรียนรู้เชิงลึกมีประสิทธิภาพเหนือกว่าผู้เชี่ยวชาญที่เป็นมนุษย์ วันนี้เราจะมาดูการเรียนรู้เชิงลึกในภาคการเงิน



หนึ่งในแอปพลิเคชั่นการเรียนรู้เชิงลึกที่น่าสนใจยิ่งกว่าคือกองทุนป้องกันความเสี่ยง กองทุนป้องกันความเสี่ยงคือกองทุนเพื่อการลงทุนองค์กรทางการเงินที่ระดมทุนจากนักลงทุนและจัดการกองทุนเหล่านี้ โดยปกติจะทำงานกับข้อมูลอนุกรมเวลาและพยายามคาดคะเน มีสถาปัตยกรรมการเรียนรู้เชิงลึกประเภทพิเศษที่เหมาะสำหรับการวิเคราะห์อนุกรมเวลา: เครือข่ายประสาทซ้ำ (RNNs) หรือโดยเฉพาะอย่างยิ่งเครือข่ายประสาทชนิดพิเศษที่เกิดซ้ำ: เครือข่ายหน่วยความจำระยะสั้นยาว (LSTM) .



LSTM สามารถรวบรวมคุณสมบัติที่สำคัญที่สุดจากข้อมูลอนุกรมเวลาและสร้างแบบจำลองการอ้างอิง แบบจำลองการทำนายราคาหุ้นจะถูกนำเสนอเป็นกรณีศึกษาที่แสดงให้เห็นว่ากองทุนป้องกันความเสี่ยงสามารถใช้ระบบดังกล่าวได้อย่างไร เฟรมเวิร์ก PyTorch ซึ่งเขียนด้วย Python ใช้เพื่อฝึกโมเดลออกแบบการทดลองและวาดผลลัพธ์



เราจะเริ่มต้นด้วยพื้นฐานการเรียนรู้เชิงลึกก่อนที่จะไปสู่ตัวอย่างในโลกแห่งความจริง:

  • แนะนำการเรียนรู้เชิงลึกเป็นแนวคิดนามธรรม
  • แนะนำ RNN หรือโดยเฉพาะอย่างยิ่ง LSTM และวิธีใช้ในการสร้างแบบจำลองข้อมูลอนุกรมเวลา
  • สร้างความคุ้นเคยให้ผู้อ่านกับข้อมูลทางการเงินที่เหมาะสำหรับการเรียนรู้เชิงลึก
  • แสดงให้เห็นว่ากองทุนป้องกันความเสี่ยงที่แท้จริงใช้การเรียนรู้เชิงลึกเพื่อทำนายราคาหุ้นอย่างไร
  • สุดท้ายให้คำแนะนำที่นำไปใช้ได้จริงสำหรับกองทุนป้องกันความเสี่ยงใหม่และที่มีอยู่เกี่ยวกับวิธีใช้ / ใช้ประโยชน์จากการเรียนรู้เชิงลึกเพื่อเพิ่มประสิทธิภาพ

นำเสนอกรณีสำหรับการซื้อขายแบบ Deep Learning

หนึ่งในงานที่ท้าทายและน่าตื่นเต้นที่สุดในอุตสาหกรรมการเงินคือการคาดการณ์ว่า ราคาหุ้นจะขึ้นหรือลง ในอนาคต. วันนี้เราทราบดีว่าอัลกอริทึมการเรียนรู้เชิงลึกสามารถแก้ปัญหางานที่ซับซ้อนได้ดีมากดังนั้นจึงควรค่าแก่การทดลองใช้ระบบการเรียนรู้เชิงลึกเพื่อดูว่าสามารถแก้ปัญหาการคาดการณ์ราคาในอนาคตได้สำเร็จหรือไม่



ตามแนวคิดแล้วโครงข่ายประสาทเทียมมีมานานแล้ว แต่ฮาร์ดแวร์ไม่ดีพอที่จะให้ทำการทดลองอย่างรวดเร็วในการเรียนรู้เชิงลึกได้ Nvidia ช่วยปฏิวัติเครือข่ายการเรียนรู้เชิงลึกเมื่อทศวรรษที่แล้วโดยเริ่มนำเสนอหน่วยประมวลผลกราฟิก (GPU) ที่รวดเร็วมากสำหรับการประมวลผลทั่วไปใน ผลิตภัณฑ์ Tesla-series . แทนที่จะแรเงารูปหลายเหลี่ยมในเกมและแอพพลิเคชั่นการออกแบบระดับมืออาชีพ GPU ที่ขนานกันสูงสามารถคำนวณข้อมูลอื่น ๆ ได้เช่นกันและในหลาย ๆ กรณีพวกมันเหนือกว่าซีพียูอย่างมาก

มีมาก เอกสารทางวิทยาศาสตร์ไม่กี่ชิ้น เกี่ยวกับการใช้การเรียนรู้เชิงลึกในด้านการเงิน แต่ความต้องการผู้เชี่ยวชาญด้านการเรียนรู้เชิงลึกจาก บริษัท ฟินเทคนั้นแข็งแกร่งเนื่องจากพวกเขาตระหนักถึงศักยภาพของมันอย่างชัดเจน บทความนี้จะช่วยอธิบายว่าเหตุใดการเรียนรู้เชิงลึกด้านการเงินจึงได้รับความนิยมมากขึ้นโดยการสรุปวิธีการใช้ข้อมูลทางการเงินในการสร้างระบบการเรียนรู้เชิงลึก โครงข่ายประสาทที่เกิดซ้ำชนิดพิเศษ - เครือข่าย LSTM - จะนำเสนอเช่นกัน เราจะสรุปว่างานที่เกี่ยวข้องกับการเงินสามารถแก้ไขได้อย่างไรโดยใช้เครือข่ายประสาทเทียมที่เกิดซ้ำ

บทความนี้ยังมีตัวอย่างกรณีศึกษาเกี่ยวกับวิธีการที่กองทุนป้องกันความเสี่ยงสามารถใช้ระบบดังกล่าวซึ่งนำเสนอผ่านการทดลอง นอกจากนี้เราจะพิจารณาว่าระบบการเรียนรู้เชิงลึกสามารถปรับปรุงได้อย่างไรและกองทุนป้องกันความเสี่ยงจะไปเกี่ยวกับการจ้างผู้มีความสามารถมาสร้างระบบเหล่านั้นได้อย่างไรกล่าวคือผู้มีความสามารถในการเรียนรู้เชิงลึกต้องมีภูมิหลังแบบใด

สิ่งที่ทำให้ Hedge Funds แตกต่างกัน

ก่อนที่เราจะดำเนินการต่อในด้านเทคนิคของปัญหาเราจำเป็นต้องอธิบายว่าอะไรที่ทำให้กองทุนป้องกันความเสี่ยงมีลักษณะเฉพาะ กองทุนป้องกันความเสี่ยงคืออะไร?

ความแตกต่างระหว่าง c corp และ s corp

กองทุนป้องกันความเสี่ยงคือกองทุนเพื่อการลงทุนซึ่งเป็นองค์กรทางการเงินที่ระดมทุนจากนักลงทุนและวางไว้ในการลงทุนระยะสั้นและระยะยาวหรือในผลิตภัณฑ์ทางการเงินที่แตกต่างกัน โดยทั่วไปจะจัดตั้งเป็นห้างหุ้นส่วนจำกัดหรือ บริษัท รับผิด จำกัด เป้าหมายของกองทุนป้องกันความเสี่ยงคือการเพิ่มผลตอบแทนสูงสุด ผลตอบแทนคือกำไรหรือขาดทุนจากมูลค่าสุทธิของกองทุนป้องกันความเสี่ยงในช่วงเวลาหนึ่ง ๆ เป็นที่ยอมรับกันโดยทั่วไปว่าเมื่อมีความเสี่ยงมากขึ้นโอกาสที่จะได้รับผลตอบแทนและการขาดทุนที่สูงขึ้นก็มีมากขึ้น

เพื่อให้ได้ผลตอบแทนที่ดีกองทุนป้องกันความเสี่ยงต้องอาศัยกลยุทธ์การลงทุนประเภทต่างๆโดยพยายามหารายได้โดยใช้ประโยชน์จากความไร้ประสิทธิภาพของตลาด เนื่องจากกลยุทธ์การลงทุนประเภทต่างๆที่ไม่ได้รับอนุญาตในกองทุนรวมที่ลงทุนทั่วไปกองทุนป้องกันความเสี่ยงจึงไม่ได้รับการจดทะเบียนเป็นกองทุนกล่าวคือมักจะไม่ได้รับการดูแลจากรัฐเหมือนกองทุนอื่น ๆ พวกเขาไม่จำเป็นต้องเผยแพร่กลยุทธ์การลงทุนและผลลัพธ์ทางธุรกิจซึ่งอาจทำให้พวกเขามีความเสี่ยง กองทุนป้องกันความเสี่ยงบางแห่งสร้างเงินได้มากกว่าค่าเฉลี่ยของตลาด แต่บางกองทุนก็เสียเงิน บางส่วนให้ผลลัพธ์ถาวรในขณะที่ผลลัพธ์ของกองทุนป้องกันความเสี่ยงบางส่วนมีความผันแปร

ด้วยการลงทุนในกองทุนป้องกันความเสี่ยงนักลงทุนจะเพิ่มมูลค่าสุทธิของกองทุน ไม่ใช่แค่ทุกคนเท่านั้นที่สามารถลงทุนในกองทุนป้องกันความเสี่ยงได้ กองทุนป้องกันความเสี่ยงมีไว้สำหรับนักลงทุนที่ร่ำรวยจำนวนน้อย โดยปกติผู้ที่ต้องการมีส่วนร่วมในกองทุนป้องกันความเสี่ยงจะต้องได้รับการรับรอง นั่นหมายความว่าพวกเขาต้องมีสถานะพิเศษเกี่ยวกับกฎหมายควบคุมทางการเงิน มีความแตกต่างในแต่ละประเทศเกี่ยวกับผู้ที่สามารถมีสถานะพิเศษนั้นได้ โดยปกติแล้วมูลค่าสุทธิของนักลงทุนจะต้องสูงมากไม่ใช่เฉพาะบุคคลเท่านั้น แต่ธนาคารและองค์กรขนาดใหญ่ก็สามารถดำเนินการในกองทุนป้องกันความเสี่ยงได้เช่นกัน การรับรองนั้นได้รับการออกแบบมาเพื่อให้เฉพาะบุคคลที่มีความรู้ด้านการลงทุนที่สำคัญเท่านั้นที่จะเข้าร่วมได้ดังนั้นจึงปกป้องนักลงทุนรายย่อยและไม่มีประสบการณ์จากความเสี่ยง

บทความนี้พิจารณากรอบการกำกับดูแลของสหรัฐอเมริกาเนื่องจากสหรัฐอเมริกามีตลาดการเงินที่พัฒนามากที่สุดในโลก ดังนั้นในสหรัฐอเมริกาคำว่า 'นักลงทุนที่ได้รับการรับรอง' จึงถูกกำหนดไว้ใน กฎ 501 ของระเบียบ D ของสำนักงานคณะกรรมการกำกับหลักทรัพย์และตลาดหลักทรัพย์แห่งสหรัฐอเมริกา (SEC) .

ตามข้อบังคับนี้ผู้ลงทุนที่ได้รับการรับรองสามารถ:

  • ธนาคาร
  • บริษัท พัฒนาธุรกิจเอกชน
  • องค์กรต่างๆ
  • กรรมการเจ้าหน้าที่บริหารและหุ้นส่วนทั่วไปของผู้ออกหลักทรัพย์ที่เสนอขายหรือขาย
  • บุคคลธรรมดาที่มีมูลค่าสุทธิของแต่ละบุคคลหรือมูลค่าสุทธิร่วมกับคู่สมรสของบุคคลนั้นเกิน 1,000,000 ดอลลาร์
  • บุคคลธรรมดาที่มีรายได้ส่วนบุคคลเกิน 200,000 ดอลลาร์ในแต่ละสองปีล่าสุดหรือมีรายได้ร่วมกับคู่สมรสของบุคคลนั้นเกิน 300,000 ดอลลาร์ในแต่ละปีเหล่านั้นและมีความคาดหวังที่สมเหตุสมผลที่จะไปถึงระดับรายได้เดียวกันในปีปัจจุบัน
  • มีทรัพย์สินรวมเกิน 5,000,000 เหรียญ
  • นิติบุคคลที่เจ้าของหุ้นทั้งหมดเป็นนักลงทุนที่ได้รับการรับรอง

ผู้จัดการกองทุนป้องกันความเสี่ยงจัดการกองทุนป้องกันความเสี่ยง ผู้จัดการกองทุนเฮดจ์ฟันด์ต้องหาวิธีสร้างความได้เปรียบในการแข่งขันเพื่อให้ประสบความสำเร็จนั่นคือสร้างความได้เปรียบเหนือคู่แข่งและความสามารถในการสร้างมูลค่าที่มากขึ้น อาจเป็นทางเลือกอาชีพที่น่าสนใจมากเนื่องจากสามารถทำกำไรได้มากหากแต่ละคนมีความเชี่ยวชาญในการจัดการกองทุน

ในอีกด้านหนึ่งหากการตัดสินใจของผู้จัดการกองทุนเฮดจ์ฟันด์จำนวนมากไม่ดีพวกเขาจะไม่ได้รับเงินและจะได้รับชื่อเสียงในทางลบ ผู้จัดการกองทุนป้องกันความเสี่ยงที่ดีที่สุดเป็นหนึ่งในอาชีพที่ได้รับค่าตอบแทนที่ดีที่สุดในทุกอุตสาหกรรม ผู้จัดการกองทุนป้องกันความเสี่ยงจะได้รับเปอร์เซ็นต์ของผลตอบแทนที่ได้รับจากนักลงทุนนอกเหนือจากค่าธรรมเนียมการจัดการ วิธีการจ่ายผลตอบแทนนี้ทำให้ผู้จัดการกองทุนป้องกันความเสี่ยงลงทุนในเชิงรุกมากขึ้นเพื่อให้ได้ผลตอบแทนมากขึ้น แต่ในทางกลับกันก็นำไปสู่การเพิ่มความเสี่ยงของนักลงทุน

ประวัติโดยย่อของกองทุนป้องกันความเสี่ยง

กองทุนป้องกันความเสี่ยงแห่งแรกปรากฏขึ้นในปีพ. ศ. 2492 ซึ่งก่อตั้งโดยอดีตนักเขียนและนักสังคมวิทยาอัลเฟรดวินสโลว์โจนส์ ในขณะที่เขากำลังเขียนบทความเกี่ยวกับแนวโน้มการลงทุนของ Fortune ในปัจจุบันย้อนกลับไปในปี 2491

เขาพยายามบริหารเงินและประสบความสำเร็จอย่างมาก เขาหาเงินโดยใช้นวัตกรรมการลงทุนซึ่งปัจจุบันเป็นที่รู้จักกันอย่างแพร่หลายว่าหุ้นระยะยาว / ระยะสั้น กลยุทธ์นี้ยังคงเป็นที่นิยมอย่างมากในหมู่กองทุนป้องกันความเสี่ยง หุ้นสามารถซื้อ (ซื้อ: long) หรือขาย (ขาย: ชอร์ต)

เมื่อราคาของหุ้นอยู่ในระดับต่ำและคาดว่าราคาของหุ้นจะสูงขึ้นมันเป็นเหตุผลที่จะซื้อหุ้น (long) และขาย (สั้น) ทันทีที่ราคาถึงจุดสูงสุดและนั่นคือ เป็นจุดเริ่มต้นของนวัตกรรมที่อัลเฟรดวินสโลว์โจนส์สร้างขึ้นนั่นคือการรับตำแหน่ง Long ในหุ้นที่คาดว่าจะแข็งค่าและสถานะสั้นในหุ้นที่คาดว่าจะลดลง

ข้อมูลทางการเงินและชุดข้อมูล

ข้อมูลการเงินเป็นของข้อมูลอนุกรมเวลา อนุกรมเวลาคือชุดของจุดข้อมูลที่จัดทำดัชนีตามเวลา โดยปกติอนุกรมเวลาคือลำดับที่เกิดขึ้นที่จุดต่อเนื่องและมีระยะห่างเท่า ๆ กันในเวลา: ลำดับของข้อมูลเวลาที่ไม่ต่อเนื่อง ตัวอย่างของอนุกรมเวลา ได้แก่ ความสูงของกระแสน้ำในมหาสมุทรจำนวนจุดดับและค่าปิดรายวันของค่าเฉลี่ยอุตสาหกรรม Dow Jones

ข้อมูลในอดีตในบริบทนี้คือข้อมูลอนุกรมเวลาจากอดีต เป็นหนึ่งในชิ้นส่วนที่สำคัญและมีค่าที่สุดสำหรับการเก็งกำไรราคาในอนาคต มีชุดข้อมูลบางชุดที่เปิดเผยต่อสาธารณะทางออนไลน์ แต่โดยปกติแล้วข้อมูลนั้นไม่มีคุณลักษณะมากนักโดยปกติจะเป็นข้อมูลช่วงเวลา 1 วันข้อมูลช่วงเวลา 1 ชั่วโมงหรือข้อมูลช่วงเวลา 1 นาที

ชุดข้อมูลที่มีคุณสมบัติที่สมบูรณ์กว่าและในช่วงเวลาที่น้อยกว่ามักจะไม่เปิดเผยต่อสาธารณะและอาจมีราคาแพงมากที่จะได้รับ ช่วงเวลาที่น้อยลงหมายถึงข้อมูลอนุกรมเวลามากขึ้นในช่วงเวลาที่กำหนด - ในหนึ่งปีมี 365 (หรือ 366) วันดังนั้นจึงมีจุดข้อมูลสูงสุด 365 (หรือ 366) จุด แต่ละวันมี 24 ชั่วโมงดังนั้นในหนึ่งปีจะมีจุดข้อมูลรายชั่วโมง 8,760 (หรือ 8,784) และแต่ละวันมี 86,400 นาทีดังนั้นในหนึ่งปีจึงมีจุดข้อมูล 525,600 (หรือ 527,040) นาที

ด้วยข้อมูลที่มากขึ้นมีข้อมูลมากขึ้นและด้วยข้อมูลที่มากขึ้นจึงเป็นไปได้ที่จะสรุปได้ดีขึ้นเกี่ยวกับสิ่งที่จะเกิดขึ้นในช่วงเวลาถัดไปโดยสมมติว่าข้อมูลประกอบด้วยคุณลักษณะที่ดีเพียงพอที่จะสรุปได้ดี ข้อมูลราคาหุ้นในช่วงปี 2550-2551 ที่วิกฤตการเงินโลกมีความเอนเอียงและอาจไม่เกี่ยวข้องกับการคาดการณ์ราคาในทุกวันนี้ ด้วยช่วงเวลาที่น้อยลงทำให้ง่ายต่อการคาดเดาสิ่งที่จะเกิดขึ้นต่อไปเนื่องจากมีจุดข้อมูลจำนวนมากในช่วงเวลาที่กำหนด มันง่ายกว่าที่จะทำนายว่าจะเกิดอะไรขึ้นในนาโนวินาทีถัดไปหากเรามีจุดข้อมูลทั้งหมดสำหรับทุกๆนาโนวินาทีในช่วงเวลาคงที่ n - ปีกว่าจะเกิดอะไรขึ้นในตลาดหุ้นในปีหน้าหากเรามีทั้งหมด n จุดข้อมูลสำหรับทุกปีในช่วงเวลาคงที่ n - ปี

อย่างไรก็ตามนั่นไม่ได้หมายความว่าหากการคาดการณ์ระยะสั้นชุดสั้น ๆ ถูกต้องการคาดการณ์ระยะยาวก็ควรจะถูกต้องเช่นกัน การคาดคะเนแต่ละครั้งนำเสนอข้อผิดพลาดและด้วยการผูกโยงการคาดการณ์หลาย ๆ การคาดการณ์ในระยะยาวจะมีข้อผิดพลาดจำนวนมากในตอนท้ายและจะไม่มีประโยชน์ ด้านล่างนี้คือตัวอย่างข้อมูลช่วงเวลา 1 วันสำหรับการแชร์ของ Google ที่คัดลอกมาทางออนไลน์จาก Yahoo Finance

ชุดข้อมูลทางการเงินของ Google หุ้นสำหรับการซื้อขายแบบอัลกอริทึม

มีคอลัมน์เพียงไม่กี่คอลัมน์ในชุดข้อมูล ได้แก่ วันที่เปิดสูงต่ำและปิดตามลำดับราคาที่หลักทรัพย์ทำการซื้อขายครั้งแรกเมื่อเปิดการแลกเปลี่ยนซึ่งเป็นราคาสูงสุดที่การรักษาความปลอดภัยทำได้ในวันซื้อขายหนึ่ง ๆ ราคาต่ำสุดที่ทำได้ในวันซื้อขายหนึ่ง ๆ และราคาสุดท้ายที่มีการซื้อขายหลักทรัพย์ในวันนั้น

โดยปกติแล้วจะมีคอลัมน์อีกสองคอลัมน์ในชุดข้อมูลดังกล่าว - Adjusted Close และ Volume แต่ไม่เกี่ยวข้องที่นี่ Adjusted Close คือราคาปิดหลังจากการปรับปรุงสำหรับการแยกและการกระจายเงินปันผลที่เกี่ยวข้องในขณะที่ Volume คือจำนวนหุ้นที่ซื้อขายในตลาดในช่วงเวลาที่กำหนด

คุณจะเห็นว่าวันที่บางส่วนหายไป วันเหล่านี้เป็นวันที่ตลาดหลักทรัพย์ไม่ทำงานโดยปกติจะเป็นช่วงวันหยุดสุดสัปดาห์และวันหยุด เพื่อจุดประสงค์ในการสาธิตอัลกอริทึมการเรียนรู้เชิงลึกของเราวันที่ขาดหายไปจะเสริมด้วยราคาที่มีอยู่ก่อนหน้านี้ ตัวอย่างเช่นราคาปิดของ 2010-01-16, 2010-01-17, 2010-01-18 ทั้งหมดจะเป็น 288.126007 เพราะนั่นคือราคาในวันที่ 2010-01-15 เป็นสิ่งสำคัญสำหรับอัลกอริทึมของเราที่ข้อมูลจะไม่มีช่องว่างดังนั้นเราจึงไม่สับสน อัลกอริทึมการเรียนรู้เชิงลึกสามารถเรียนรู้ได้จากที่นี่เมื่อถึงวันหยุดสุดสัปดาห์และวันหยุดเช่นจะเรียนรู้ว่าหลังจากห้าวันทำการแล้วจะต้องมีราคาคงที่สองวันจากวันทำการสุดท้าย

การแสดงภาพของการเคลื่อนไหวของราคาหุ้นของ Google ในช่วงเวลาหนึ่ง

นี่คือกราฟการเคลื่อนไหวของราคาหุ้นของ Google ตั้งแต่ปี 2010-01-04 โปรดทราบว่าจะใช้เฉพาะวันซื้อขายเท่านั้นในการลงจุดกราฟ

Deep Learning คืออะไร?

การเรียนรู้เชิงลึกเป็นส่วนหนึ่งของการเรียนรู้ของเครื่องและขึ้นอยู่กับการนำเสนอข้อมูลการเรียนรู้ การเรียนรู้ของเครื่องจะตรวจสอบอัลกอริทึมที่ไม่ได้ตั้งโปรแกรมการทำงาน แต่เรียนรู้จากข้อมูล โดยพื้นฐานแล้วเป็นแนวทางสำหรับปัญญาประดิษฐ์

การเรียนรู้เชิงลึกถูกนำไปใช้กับสาขาต่างๆไม่ว่าจะเป็นการมองเห็นด้วยคอมพิวเตอร์การรู้จำเสียงการประมวลผลภาษาธรรมชาติการแปลด้วยเครื่องและในบางส่วนของงานเหล่านี้ก็มีประสิทธิภาพที่เหนือกว่ามนุษย์

โครงข่ายประสาทเทียมเป็นศูนย์กลางของการเรียนรู้เชิงลึก ตัวอย่างที่เรียบง่ายและเป็นพื้นฐานที่สุดของโครงข่ายประสาทเทียมแบบลึกคือโครงข่ายประสาทเทียมแบบป้อนกลับ ด้านล่างนี้คือภาพของโครงข่ายประสาทเทียมแบบง่าย ประกอบด้วยชั้นอินพุตและเอาต์พุตและเลเยอร์ที่ซ่อนอยู่

แผนภาพของโครงข่ายประสาทเทียมแบบป้อนไปข้างหน้าโดยมีชั้นอินพุตและเอาต์พุตและการเรียนรู้ที่แสดงเป็นโหนด

เลเยอร์ที่ซ่อนอยู่คือเลเยอร์ทั้งหมดระหว่างเลเยอร์อินพุตและเอาต์พุต เรากล่าวว่าโครงข่ายประสาทเทียมนั้นลึกถ้ามีชั้นซ่อนอยู่มากกว่าหนึ่งชั้น แต่ละชั้นประกอบด้วยเซลล์ประสาทจำนวนต่างๆ เลเยอร์ในโครงข่ายประสาทเทียมพื้นฐานนี้เรียกว่าเลเยอร์เชิงเส้น - เซลล์ประสาทในเลเยอร์เชิงเส้นจะคูณค่าของ 1-D (หรือ 2-D เท่านั้นหากข้อมูลถูกส่งผ่านเครือข่ายเป็นแบทช์) ด้วยน้ำหนักที่เหมาะสมรวมผลิตภัณฑ์เข้าด้วยกันและ ให้ผลลัพธ์สุดท้ายเป็นเอาต์พุต 1-D หรือ 2-D

โดยปกติแล้วฟังก์ชันการเปิดใช้งานจะถูกนำไปใช้ในเครือข่าย feedforward เพื่อแนะนำความไม่เชิงเส้นเพื่อให้เครือข่ายสามารถจำลองปัญหาที่ซับซ้อนและไม่เชิงเส้นได้มากขึ้น ในเครือข่าย feedforward ข้อมูลจะไหลจากชั้นอินพุตไปยังชั้นเอาต์พุตโดยไม่วนกลับ การเชื่อมต่อระหว่างเซลล์ประสาทมีน้ำหนัก ต้องปรับน้ำหนักเพื่อให้โครงข่ายประสาทส่งคืนเอาต์พุตที่ถูกต้องสำหรับอินพุตที่กำหนด เครือข่าย feedforward จะแมปข้อมูลจากพื้นที่อินพุตไปยังพื้นที่เอาต์พุต เลเยอร์ที่ซ่อนอยู่จะดึงคุณสมบัติที่สำคัญและเป็นนามธรรมออกจากคุณสมบัติของเลเยอร์ก่อนหน้า

อัปเกรด python 2 เป็น 3

ไปป์ไลน์การเรียนรู้เชิงลึกทั่วไปเหมือนกับท่อการเรียนรู้ของเครื่องและประกอบด้วยขั้นตอนต่อไปนี้:

  1. การเก็บรวบรวมข้อมูล. ข้อมูลแบ่งออกเป็นสามส่วนคือข้อมูลการฝึกอบรมข้อมูลการตรวจสอบและข้อมูลการทดสอบ
  2. การฝึกอบรม DNN โดยใช้ข้อมูลการฝึกอบรมใน 'ยุค' จำนวนหนึ่ง (แต่ละครั้งประกอบด้วยการทำซ้ำหลายครั้ง) และการตรวจสอบความถูกต้องหลังจากแต่ละยุคโดยใช้ข้อมูลการตรวจสอบความถูกต้อง
  3. การทดสอบแบบจำลอง (อินสแตนซ์ของโครงข่ายประสาทเทียมที่มีพารามิเตอร์คงที่) หลังจากลำดับของการฝึกอบรมและการตรวจสอบความถูกต้อง

การฝึกโครงข่ายประสาทหมายถึงการปรับน้ำหนักระหว่างคู่ของเซลล์ประสาทโดยการลดฟังก์ชันการสูญเสียโดยใช้อัลกอริธึม backpropagation ร่วมกับการสืบเชื้อสายไล่ระดับสุ่มแบบสุ่ม ยกเว้นน้ำหนักที่กำหนดผ่านกระบวนการเรียนรู้โดยทั่วไปแล้วอัลกอริธึมการเรียนรู้เชิงลึกจะต้องตั้งค่าไฮเปอร์พารามิเตอร์ซึ่งเป็นพารามิเตอร์ที่ไม่ได้เรียนรู้ แต่ได้รับการแก้ไขก่อนการเรียนรู้ ไฮเปอร์พารามิเตอร์คือจำนวนชั้นจำนวนเซลล์ประสาทในชั้นประเภทของชั้นประเภทของเซลล์ประสาทและการเริ่มต้นน้ำหนัก

มีข้อ จำกัด ด้านฮาร์ดแวร์ในการตั้งค่าไฮเปอร์พารามิเตอร์ ในปัจจุบันยังไม่สามารถสร้างเซลล์ประสาทหนึ่งล้านล้านเซลล์บน GPU เดียวได้ ปัญหาที่สองสำหรับการค้นหาไฮเปอร์พารามิเตอร์อย่างละเอียดถี่ถ้วนคือการระเบิดร่วมกัน เป็นไปไม่ได้ที่จะค้นหาชุดค่าผสมของไฮเปอร์พารามิเตอร์ที่เป็นไปได้ทั้งหมดเนื่องจากจะใช้เวลาไม่สิ้นสุด ด้วยเหตุนี้ไฮเปอร์พารามิเตอร์จึงถูกตั้งค่าแบบสุ่มหรือใช้ฮิวริสติกส์และตัวอย่างที่รู้จักกันดีซึ่งอธิบายไว้ในเอกสารทางวิทยาศาสตร์ซึ่งเป็นหนึ่งในพารามิเตอร์ไฮเปอร์พารามิเตอร์ที่ใช้สำหรับการวิเคราะห์ข้อมูลทางการเงินที่แสดงในภายหลังในบล็อกโพสต์นี้คือการใช้เซลล์ประสาทที่เกิดซ้ำในขณะที่นักวิทยาศาสตร์และวิศวกร ได้พิสูจน์แล้วว่าทำงานได้ดีกับข้อมูลอนุกรมเวลา โดยปกติวิธีที่ดีที่สุดในการดูว่าไฮเปอร์พารามิเตอร์สำหรับปัญหานั้นดีหรือไม่คือการทดลอง

ประเด็นของการฝึกอบรมคือการทำให้โครงข่ายประสาทเทียมพอดีกับข้อมูลการฝึกอบรม การตรวจสอบโมเดลทั้งสองแบบซึ่งจะทำหลังจากแต่ละขั้นตอนการฝึกอบรมและการทดสอบแบบจำลองซึ่งทำหลังจากขั้นตอนการฝึกอบรมทั้งหมดเสร็จสิ้นเพื่อดูว่าโมเดลสามารถสรุปได้ดีหรือไม่ ลักษณะทั่วไปหมายความว่าโครงข่ายประสาทเทียมสามารถคาดเดาข้อมูลใหม่ที่มองไม่เห็นได้ดี

มีคำศัพท์สำคัญสองคำที่เกี่ยวข้องกับการเลือกโมเดล: ฟิตติ้งมากเกินไป และ underfitting . หากโครงข่ายประสาทเทียมมีความซับซ้อนเกินไปเกี่ยวกับข้อมูลที่ได้รับการฝึกฝน - หากมีพารามิเตอร์มากเกินไป (หลายชั้นเกินไปและ / หรือเซลล์ประสาทในชั้นมากเกินไป) เครือข่ายประสาทเทียมอาจพอดีกับข้อมูล สามารถปรับให้เข้ากับข้อมูลการฝึกอบรมได้ดีเนื่องจากมีความจุมากเกินพอที่จะใส่ข้อมูลทั้งหมดได้ แต่ประสิทธิภาพในการตรวจสอบความถูกต้องและชุดทดสอบก็ไม่ดี

หากโครงข่ายประสาทเทียมนั้นเรียบง่ายเกินไปเกี่ยวกับข้อมูลที่ได้รับการฝึกฝนเครือข่ายประสาทเทียมก็สามารถรองรับข้อมูลได้ ในกรณีนั้นเครือข่ายประสาทเทียมมีประสิทธิภาพต่ำในการฝึกการตรวจสอบความถูกต้องและชุดทดสอบเนื่องจากความสามารถไม่ดีพอที่จะพอดีกับข้อมูลการฝึกอบรมและเพื่อสรุป ในภาพด้านล่างคำศัพท์เหล่านั้นอธิบายแบบกราฟิก เส้นสีน้ำเงินแสดงถึงสิ่งที่จำลองโดยโครงข่ายประสาทเทียม ภาพแรกแสดงสถานการณ์เมื่อมีพารามิเตอร์เครือข่ายประสาทเทียมน้อยไม่เพียงพอที่จะพอดีกับข้อมูลการฝึกอบรมและเพื่อสรุป ภาพที่สองแสดงสถานการณ์เมื่อมีจำนวนพารามิเตอร์ที่เหมาะสมที่สุดและโครงข่ายประสาทเทียมสามารถสรุปข้อมูลที่มองไม่เห็นได้เป็นอย่างดีและภาพที่สามแสดงสถานการณ์เมื่อจำนวนพารามิเตอร์ของโครงข่ายประสาทมีขนาดใหญ่เกินไปและโครงข่ายประสาทเทียมสามารถทำได้อย่างสมบูรณ์แบบ พอดีกับข้อมูลทั้งหมดจากชุดฝึก แต่มีประสิทธิภาพต่ำในการตรวจสอบความถูกต้องและชุดทดสอบ

การแสดงภาพกราฟิกของสถานการณ์ชุดชั้นในที่เหมาะสมและมากเกินไป

เครือข่ายประสาทที่กำเริบ

เครือข่ายประสาทเทียมเวอร์ชันที่ซับซ้อนกว่านั้นคือเครือข่ายประสาทที่เกิดซ้ำ ในเครือข่ายประสาทที่เกิดซ้ำข้อมูลสามารถไหลไปในทิศทางใดก็ได้ซึ่งต่างจากเครือข่ายประสาทเทียมแบบป้อนกลับ พวกเขาสามารถเรียนรู้การอ้างอิงอนุกรมเวลาได้ดี สถาปัตยกรรมของโครงข่ายประสาทที่เกิดซ้ำทั่วไปแสดงในภาพด้านล่าง

สกาล่า (ภาษาโปรแกรม)

การแสดงกราฟิกของสถาปัตยกรรม rnn ทั่วไป

ในภาพด้านล่างแสดงเซลล์ประสาทที่เกิดซ้ำหนึ่งเซลล์ ใช้เวลา X_{t} ชี้เวลา t เป็นอินพุตและส่งกลับ h_{t} สถานะที่ซ่อนอยู่ในเวลา t เป็นเอาต์พุต ผลลัพธ์ที่ซ่อนอยู่จะแพร่กระจายกลับไปยังเซลล์ประสาท เซลล์ประสาทกำเริบสามารถคลายออกได้ตามที่แสดงในภาพเดียวกันจากด้านขวา X_{t_0} เป็นจุดในช่วงเวลา t_{0}, X_{t_1} ในช่วงเวลา t_{1} และ X_{t} ในช่วงเวลา t. ผลลัพธ์ที่ได้จากอินพุต X_{t_0}, X_{t_1}, …, X_{t_n} ในช่วงเวลา t_{0}, t_{1}, …, t_{n} เรียกว่าเอาต์พุตที่ซ่อนอยู่: h_{t_0}, h_{t_1}, …, h_{t_n} ตามลำดับ

ภาพประกอบที่เป็นภาพของโครงสร้าง i / o ของเซลล์ประสาทที่เกิดซ้ำ

หนึ่งในสถาปัตยกรรมเครือข่ายประสาทที่เกิดซ้ำที่ดีที่สุดคือสถาปัตยกรรม LSTM LSTM แสดงไว้ด้านล่าง:

การสร้างภาพสถาปัตยกรรม lstm

LSTM มีโครงสร้างทั่วไปเช่นเดียวกับเครือข่ายประสาทที่เกิดซ้ำทั่วไป แต่เซลล์ประสาทที่เกิดซ้ำนั้นแตกต่างกันเล็กน้อยโดยมีโครงสร้างที่ซับซ้อนกว่า จะเห็นได้จากภาพด้านบนว่ามีการคำนวณจำนวนมากภายในเซลล์ LSTM หนึ่งเซลล์ เซลล์ LSTM สามารถสังเกตได้เป็นกล่องดำในบริบทของโพสต์นี้ แต่สำหรับผู้อ่านที่อยากรู้อยากเห็นมากขึ้นสิ่งนี้ยอดเยี่ยม โพสต์บล็อก อธิบายการคำนวณภายใน LSTM และอื่น ๆ อีกมากมาย

ให้เราเรียกอินพุตสำหรับเครือข่ายประสาทเทียมว่า 'feature vector' มันคือ n - เวกเตอร์มิติที่มีองค์ประกอบเป็นคุณสมบัติ: f_{0}, f_{1}, f_{2} …, f_{n}.

vv{X} = [f_{0}, f_{1}, f_{2}, …, f_{n}]

ตอนนี้เรามาอธิบายกันว่าเครือข่ายประสาทเทียมที่เกิดซ้ำสามารถนำไปใช้กับงานที่เกี่ยวข้องกับการเงินได้อย่างไร อินพุตสำหรับเครือข่ายประสาทที่เกิดซ้ำคือ [X_{t_0}, X_{t_1}, X_{t_2}, …, X_{t_n}] สมมติว่า n = 5. เราใช้ราคาหุ้น Google Close ห้าวันจากห้าวันติดต่อกัน (ดูตารางพร้อมข้อมูลเปิด / สูง / ต่ำ / ปิดด้านบน) ระหว่าง 2010-01-04 และ 2010-01-08 เช่น [[311.35], [309.98], [302.16], [295.13], [299.06]] . เวกเตอร์คุณลักษณะในตัวอย่างนี้เป็นมิติเดียว ลำดับเวลาประกอบด้วยเวกเตอร์คุณลักษณะดังกล่าวห้าตัว ผลลัพธ์ของโครงข่ายประสาทเทียมที่เกิดซ้ำเป็นคุณสมบัติที่ซ่อนอยู่ [h_{t_0}, h_{t_1}, h_{t_2}, …, h_{t_n}] คุณลักษณะเหล่านั้นอยู่ในระดับนามธรรมมากกว่าคุณลักษณะการป้อนข้อมูล [X_{t_0}, X_{t_1}, X_{t_2}, …, X_{t_n}] —LSTM ควรเรียนรู้ส่วนสำคัญของคุณลักษณะการป้อนข้อมูลและฉายไปยังพื้นที่คุณลักษณะที่ซ่อนอยู่ คุณสมบัติที่ซ่อนอยู่และนามธรรมเหล่านั้นสามารถแพร่กระจายในเซลล์ LSTM ถัดไปซึ่งจะให้ชุดต่อไปของคุณสมบัติที่ซ่อนอยู่และเป็นนามธรรมมากขึ้นซึ่งสามารถแพร่กระจายไปยัง LSTM ถัดไปได้อีกครั้งและอื่น ๆ หลังจากลำดับของ LSTM ที่ถูกล่ามโซ่ส่วนประกอบสุดท้ายของเครือข่ายประสาทเทียมคือเลเยอร์เชิงเส้น (ส่วนสร้างของเครือข่าย feedforward แบบง่ายที่อธิบายไว้ในส่วนก่อนหน้า) ซึ่งจะจับคู่คุณสมบัติที่ซ่อนอยู่จาก LSTM สุดท้ายไปยังจุดในพื้นที่มิติเดียวและ จุดนั้นคือผลลัพธ์สุดท้ายของเครือข่าย - ราคาปิดที่คาดการณ์ไว้ในช่วงเวลา X_{t+1} ความจริงพื้นดินในตัวอย่างนี้สำหรับ X_{t+1} คือ 298.61.

บันทึก: นอกจากนี้ยังมี LSTM เพียงตัวเดียวการตั้งค่าจำนวน LSTM เป็นไฮเปอร์พารามิเตอร์ซึ่งโดยทั่วไปมักพบในเชิงประจักษ์แม้ว่าเราจะสามารถใช้การวิเคราะห์พฤติกรรมบางอย่างได้ หากข้อมูลไม่ซับซ้อนเราจะใช้สถาปัตยกรรมที่ซับซ้อนน้อยกว่าดังนั้นโมเดลจึงไม่พอดีกับข้อมูล หากข้อมูลมีความซับซ้อนเราจะใช้แบบจำลองที่ซับซ้อนดังนั้นแบบจำลองจึงไม่เหมาะสมกับข้อมูล

ในขั้นตอนการฝึกอบรมราคาปิดที่คาดการณ์ไว้จะถูกเปรียบเทียบกับราคาความจริงภาคพื้นดินและความแตกต่างระหว่างราคาปิดที่คาดการณ์ไว้และราคาความจริงพื้นดินจะถูกย่อให้เล็กลงโดยใช้อัลกอริธึม backpropagation และอัลกอริธึมการเพิ่มประสิทธิภาพการไล่ระดับสี (หรือรูปแบบใดรูปแบบหนึ่ง - ในรูปแบบนี้ บล็อกใช้อัลกอริธึมการเพิ่มประสิทธิภาพการไล่ระดับสีที่เรียกว่า 'Adam') โดยการเปลี่ยนน้ำหนักของโครงข่ายประสาทเทียม

หลังจากการฝึกอบรมและการทดสอบในอนาคตผู้ใช้เพียงแค่ให้ข้อมูลอินพุตไปยังเครือข่ายประสาทเทียมและจะส่งคืนราคาที่คาดการณ์ไว้ (และหวังว่าราคาจะใกล้เคียงกับราคาความจริงพื้นฐานในอนาคต)

อีกสิ่งหนึ่งที่จะกล่าวถึงในที่นี้ก็คือโดยปกติแล้วชุดข้อมูลจะถูกส่งผ่านเครือข่ายทั้งในการฝึกอบรมในขั้นตอนการทดสอบเพื่อให้เครือข่ายคำนวณเอาต์พุตหลายรายการในรอบเดียว

ด้านล่างนี้คือภาพของสถาปัตยกรรมที่ใช้ในบล็อกนี้สำหรับการทดลอง ประกอบด้วย LSTM ที่ซ้อนกันสองชั้นและเลเยอร์เชิงเส้นหนึ่งชั้น

การแสดงภาพของสถาปัตยกรรมที่อธิบายไว้ข้างต้น

การทดลองกับกองทุนป้องกันความเสี่ยงอัลกอริทึม

ลองใช้กลยุทธ์การซื้อขายแบบอัลกอริทึมที่เรียบง่ายดังต่อไปนี้: หากอัลกอริทึมคาดการณ์ว่าราคาจะขึ้นในวันถัดไปให้ซื้อ n (n = 1 ในตัวอย่างนี้) หุ้นของ บริษัท (long) หรือขายหุ้นทั้งหมดของ บริษัท (สั้น) มูลค่าเริ่มต้นของพอร์ตการลงทุน (มูลค่าของเงินสดและหุ้นรวมกัน) กำหนดไว้ที่ $ 100,000 แต่ละการกระทำยาวหรือสั้นจะซื้อ n หุ้นของ บริษัท (ในตัวอย่างนี้ Google) หรือขายหุ้นทั้งหมดของ บริษัท ตามลำดับ ในการเริ่มต้นระบบมีหุ้น 0 หุ้นของ บริษัท หนึ่ง ๆ

โปรดจำไว้เสมอว่านี่เป็นตัวอย่างพื้นฐานและเรียบง่ายไม่ได้มีไว้สำหรับใช้ในโลกแห่งความเป็นจริงเนื่องจากจำเป็นต้องมีงานวิจัยและพัฒนาจำนวนมากขึ้นเพื่อปรับแต่งโมเดลให้ทำงานได้ดีในทางปฏิบัติ บางสิ่งถูกละเลยที่นี่ซึ่งควรได้รับการพิจารณาในสถานการณ์จริง ตัวอย่างเช่นค่าธรรมเนียมการทำธุรกรรมจะไม่รวมอยู่ในแบบจำลอง สันนิษฐานว่าระบบสามารถซื้อขายในเวลาเดียวกันทุกวันและสมมติว่าทุกวันแม้ในวันหยุดสุดสัปดาห์หรือวันหยุดจะเป็นวันซื้อขาย

สำหรับการทดสอบจะใช้วิธีการทดสอบย้อนหลัง วิธีการทดสอบย้อนหลังใช้ข้อมูลในอดีตเพื่อสร้างการซื้อขายใหม่ที่จะเกิดขึ้นในอดีตโดยใช้กฎที่กำหนดไว้กับกลยุทธ์ที่พัฒนาขึ้น ชุดข้อมูลแบ่งออกเป็นสองส่วน - ส่วนแรกคือชุดการฝึก (อดีต) และส่วนที่สองคือชุดการทดสอบ (อนาคต) แบบจำลองได้รับการฝึกฝนในชุดการฝึกและหลังจากการฝึกอบรมเราจะจำลองอนาคตในส่วนที่สองของชุดข้อมูลเพื่อดูว่าแบบจำลองที่ผ่านการฝึกอบรมจะมีพฤติกรรมอย่างไรในอนาคตโดยไม่ได้รับการฝึกฝน

เมตริกในการประเมินกลยุทธ์การซื้อขายคือ Sharpe Ratio (เป็นเวอร์ชันต่อปีโดยสมมติว่าทุกวันในหนึ่งปีเป็นวันซื้อขายและปีมี 365 วัน: sqrt(365)*mean(returns)/std(returns)) โดยที่ผลตอบแทนถูกกำหนดเป็น p_{t}/p_{t-1} - 1 และ p_{t} คือราคาในช่วงเวลา t Sharpe Ratio แสดงอัตราส่วนระหว่างผลตอบแทนและความเสี่ยงเพิ่มเติมที่เกิดขึ้นดังนั้นจึงเป็นการดีที่จะมีอัตราส่วน Sharpe ที่มากขึ้นโดยปกติ a อัตราส่วนที่มากกว่า 1 เป็นที่ยอมรับของนักลงทุน 2 ดีมากและ 3 ดีมาก

เฉพาะราคาปิดในแต่ละวันของราคาย้อนหลังของ Google จากชุดข้อมูล Yahoo Finance เท่านั้นที่ใช้เป็นคุณลักษณะ คุณลักษณะเพิ่มเติมจะช่วยได้ แต่จะอยู่นอกขอบเขตของบล็อกนี้ในการทดสอบว่าคุณลักษณะอื่น ๆ จากชุดข้อมูลใด (เปิดสูงต่ำ) มีความสำคัญ คุณสมบัติอื่น ๆ บางอย่างที่ไม่รวมอยู่ในตารางอาจเป็นประโยชน์เช่นความรู้สึกของข่าวในช่วงเวลาหนึ่งหรือเหตุการณ์สำคัญในวันหนึ่ง ๆ อย่างไรก็ตามบางครั้งการแสดงข้อมูลที่เป็นประโยชน์สำหรับอินพุตเครือข่ายประสาทเทียมและรวมเข้ากับคุณสมบัติที่มีอยู่นั้นเป็นเรื่องยากมาก ตัวอย่างเช่นการขยายเวกเตอร์คุณลักษณะเป็นเรื่องง่ายและใส่ตัวเลขที่แสดงถึงความเชื่อมั่นของข่าวหรือความเชื่อมั่นในทวีตของทรัมป์ (-1 เชิงลบมาก, 0 เป็นกลาง, +1 บวกมาก ฯลฯ ) ในแต่ละช่วงเวลาที่กำหนด แต่มันไม่ง่ายเลยที่จะใส่ช่วงเวลาที่ขับเคลื่อนด้วยเหตุการณ์โดยเฉพาะ (โจรสลัดในคลองสุเอซระเบิดในโรงกลั่นในเท็กซัส) ในเวกเตอร์คุณลักษณะเนื่องจากในแต่ละช่วงเวลาที่เฉพาะเจาะจงเราจะต้องมี องค์ประกอบเพิ่มเติมในเวกเตอร์คุณลักษณะที่จะใส่ 1 หากเหตุการณ์เกิดขึ้นหรือ 0 มิฉะนั้นจะนำไปสู่องค์ประกอบจำนวนไม่ จำกัด สำหรับช่วงเวลาที่เป็นไปได้ทั้งหมด

สำหรับข้อมูลที่ยากกว่านั้นเราสามารถกำหนดหมวดหมู่บางหมวดหมู่และในแต่ละช่วงเวลาให้พิจารณาว่าเป็นหมวดหมู่ใด นอกจากนี้เรายังสามารถเพิ่มคุณลักษณะจากหุ้นของ บริษัท อื่น ๆ เพื่อให้ระบบเรียนรู้ความสัมพันธ์ระหว่างราคาหุ้นของ บริษัท ต่างๆ นอกจากนี้ยังมีเครือข่ายประสาทเทียมประเภทหนึ่งที่มีไว้สำหรับการมองเห็นของคอมพิวเตอร์ซึ่งก็คือโครงข่ายประสาทเทียมแบบ Convolutional ซึ่งน่าสนใจที่จะรวมกับเลเยอร์ที่เกิดซ้ำและดูว่าคุณสมบัติภาพมีความสัมพันธ์กับราคาของบาง บริษัท อย่างไร บางทีเราอาจใช้ฟีดของกล้องจากสถานีรถไฟที่มีคนพลุกพล่านเป็นฟีเจอร์และแนบฟีดนั้นเข้ากับโครงข่ายประสาทเทียมและดูว่าสิ่งที่เครือข่ายประสาทเทียมเห็นนั้นสัมพันธ์กับราคาหุ้นของบาง บริษัท หรือไม่ - อาจมีความรู้บางอย่างซ่อนอยู่แม้ในนั้น ตัวอย่างซ้ำซากและไร้สาระ

ด้านล่างนี้เป็นกราฟที่แสดงให้เห็นว่าการสูญเสียการฝึกโดยเฉลี่ยลดลงเมื่อเวลาผ่านไปซึ่งหมายความว่าโครงข่ายประสาทเทียมมีความสามารถเพียงพอที่จะใส่ข้อมูลการฝึกอบรมได้ สิ่งสำคัญคือต้องบอกว่าข้อมูลต้องได้รับการทำให้เป็นมาตรฐานเพื่อที่อัลกอริทึมการเรียนรู้เชิงลึกจะมาบรรจบกันได้

กราฟการเทรดแบบ Deep learning แสดงการสูญเสียโดยเฉลี่ยในช่วงเวลาหนึ่ง

ด้านล่างนี้เป็นกราฟที่แสดงให้เห็นว่าการสูญเสียการทดสอบโดยเฉลี่ยลดลงเมื่อเวลาผ่านไปซึ่งหมายความว่าโครงข่ายประสาทเทียมมีความสามารถในการสรุปข้อมูลที่มองไม่เห็น

กราฟการเทรดแบบ Deep learning แสดงการสูญเสียการทดสอบโดยเฉลี่ยในช่วงเวลาหนึ่ง

อัลกอริทึมเป็นคนโลภ หากคาดการณ์ว่าราคาจะขึ้นในวันถัดไปอัลกอริทึมจะซื้อ n=1 ทันที หุ้นของ บริษัท (หากมีเงินสดเพียงพอในพอร์ตการลงทุน) มิฉะนั้นจะขายหุ้นทั้งหมดของ บริษัท (ถ้ามี) ระยะเวลาการลงทุนคงที่และใช้เวลา 300 วัน หลังจาก 300 วันหุ้นทั้งหมดจะถูกขาย การจำลองข้อมูลที่มองไม่เห็นหลังการฝึกอบรมสามารถดูได้ด้านล่าง แสดงให้เห็นว่ามูลค่าพอร์ตการลงทุนเพิ่มขึ้นเมื่อเวลาผ่านไปโดยการดำเนินการแบบยาว / สั้น (หรือไม่ทำอะไรเลย) ในแต่ละวัน

บันทึกสาธารณะ คำถามที่พบบ่อย ติดต่อ อินเทอร์เฟซมือถือ

กราฟการเงิน Deep Learning แสดงการจำลองข้อมูลที่มองไม่เห็น

อัตราส่วน Sharpe สำหรับการจำลองด้านบนคือ 1.48 มูลค่าผลงานสุดท้ายหลังจาก 300 วันคือ $ 100,263.79 หากเราเพิ่งซื้อหุ้นในวันแรกและขายหลังจาก 300 วันพอร์ตการลงทุนจะมีมูลค่า $ 99,988.41

ด้านล่างนี้เป็นสถานการณ์ที่โครงข่ายประสาทเทียมไม่ได้รับการฝึกฝนอย่างดีและสูญเสียเงินหลังจากระยะเวลาคงที่ 300 วัน

ผลการซื้อขายโครงข่ายประสาทเทียม

อัตราส่วน Sharpe คือ -0.94 มูลค่าผลงานสุดท้ายหลังจาก 300 วันคือ $ 99,868.36

ต่อไปนี้เป็นตัวอย่างที่น่าสนใจ - อัลกอริทึมข้างต้นเป็นเพียงแค่การคาดเดาราคาสำหรับวันถัดไปโดยดำเนินการตามการคาดการณ์นั้นเพียงอย่างเดียว เป็นไปได้ที่จะเชื่อมโยงการคาดการณ์หลายรายการและคาดการณ์ราคาในอีกไม่กี่ขั้นตอนถัดไปในอนาคต ตัวอย่างเช่นด้วยอินพุตแรกของ [X_ground_truth_{t0}, X_ground_truth_{t1}, X_ground_truth_{t2}, X_ground_truth_{t3}, X_ground_truth_{t4}] และผลลัพธ์แรกคือ [X_predicted_{t5}] เราสามารถป้อนเครือข่ายประสาทเทียมด้วยการทำนายนั้นเพื่อให้อินพุตถัดไปคือ [X_ground_truth_{t1}, X_ground_truth_{t2}, X_ground_truth_{t3}, X_ground_truth_{t4}, X_predicted_{t5}] และผลลัพธ์คือ [X_predicted_{t6}] อินพุตถัดไปคือ [X_ground_truth_{t2}, X_ground_truth_{t3}, X_ground_truth_{t4}, X_predicted_{t5}, X_predicted_{t6}] ซึ่งให้ผลลัพธ์เป็น [X_predicted_{t7}] และอื่น ๆ ปัญหาคือเรากำลังนำเสนอข้อผิดพลาดในการคาดการณ์ที่เพิ่มขึ้นในแต่ละขั้นตอนใหม่และสุดท้ายลงเอยด้วยผลลัพธ์ระยะยาวที่แย่มากดังที่แสดงในภาพด้านล่าง การทำนายในช่วงแรกเป็นไปตามแนวโน้มความจริงพื้นดินที่ลดลงจากนั้นก็หยุดนิ่งและแย่ลงเรื่อย ๆ เมื่อเวลาผ่านไป

กราฟแสดงการคาดคะเนสะสมที่ตรงข้ามกับความจริงพื้นฐานของมูลค่าหุ้น

การวิเคราะห์การเรียนรู้เชิงลึกที่เรียบง่ายเกิดขึ้นในราคาหุ้นของ Google แต่สามารถรวมข้อมูลทางการเงินได้เกือบทุกชุดหากข้อมูลมีจำนวนมากเพียงพอและมีคุณภาพดี ข้อมูลจะต้องมีการเลือกปฏิบัติและต้องอธิบายและเป็นตัวแทนของปัญหาได้ดี

ห่อ

หากใช้งานได้ดีและสรุปได้ดีในการทดสอบอย่างละเอียดระบบนี้อาจช่วยให้ผู้จัดการกองทุนเฮดจ์ฟันด์สามารถคาดเดาเกี่ยวกับราคาหุ้นของ บริษัท ในอนาคตโดยใช้การเรียนรู้เชิงลึกและอาศัยกลยุทธ์การซื้อขายแบบอัลกอริทึม

ผู้จัดการกองทุนป้องกันความเสี่ยงสามารถให้เงินแก่ระบบเพื่อทำการซื้อขายโดยอัตโนมัติทุกวัน อย่างไรก็ตามจะเป็นการดีที่จะปล่อยให้อัลกอริทึมการซื้อขายอัตโนมัติทำการค้าโดยไม่มีการควบคุมดูแล ผู้จัดการกองทุนป้องกันความเสี่ยงควรมีทักษะในการเรียนรู้เชิงลึกหรือจ้างคนที่มีทักษะที่จำเป็นเพื่อดูแลระบบและพิจารณาว่าเมื่อใดที่ระบบสูญเสียความสามารถในการพูดคุยทั่วไปและการซื้อขายที่ดี

หากระบบสูญเสียความสามารถในการพูดคุยทั่วไปก็จำเป็นต้องฝึกอบรมใหม่ตั้งแต่ต้นและทดสอบอีกครั้ง (อาจจะโดยการแนะนำคุณลักษณะที่เลือกปฏิบัติเพิ่มเติมหรือความรู้ใหม่โดยใช้ข้อมูลใหม่จากอดีตที่ไม่มีอยู่เมื่อเป็นแบบจำลอง ฝึกครั้งแรก).

บางครั้งข้อมูลก็ไม่ดีพอที่ระบบการเรียนรู้เชิงลึกจะได้รับการฝึกฝนและสรุปได้ดีและในกรณีนั้น วิศวกรการเรียนรู้เชิงลึกที่มีประสบการณ์ ควรจะสามารถตรวจจับและแก้ไขสถานการณ์ดังกล่าวได้ ในการสร้างระบบการซื้อขายแบบเรียนรู้เชิงลึกคุณจำเป็นต้องมีนักวิทยาศาสตร์ด้านข้อมูลกองทุนป้องกันความเสี่ยงการเรียนรู้ของเครื่อง / ผู้เชี่ยวชาญด้านการเรียนรู้เชิงลึก (ทั้งนักวิทยาศาสตร์และวิศวกร) วิศวกร R&D ที่คุ้นเคยกับการเรียนรู้ของเครื่อง / การเรียนรู้เชิงลึกเป็นต้นไม่ว่าจะใช้แมชชีนเลิร์นนิงในส่วนใด พวกเขาคุ้นเคยไม่ว่าจะเป็นการมองเห็นด้วยคอมพิวเตอร์หรือการรู้จำเสียงผู้เชี่ยวชาญที่มีประสบการณ์จะสามารถนำประสบการณ์ของตนไปใช้ประโยชน์ในภาคการเงินได้ ที่รากฐานการเรียนรู้เชิงลึกมีพื้นฐานเหมือนกันไม่ว่าจะเป็นแอปพลิเคชันหรืออุตสาหกรรมใดและควรเป็นเรื่องง่ายสำหรับผู้ที่มีประสบการณ์ในการเปลี่ยนจากธีมเป็นธีม

ระบบที่เรานำเสนอนั้นเป็นระบบพื้นฐานมากและในการนำไปใช้ในโลกแห่งความเป็นจริงควรทำ R&D เพิ่มเติมเพื่อเพิ่มผลตอบแทน การปรับปรุงระบบที่เป็นไปได้อาจเป็นการพัฒนากลยุทธ์การซื้อขายที่ดีขึ้น การรวบรวมข้อมูลเพิ่มเติมสำหรับการฝึกอบรมซึ่งมักมีราคาแพงมากจะช่วยได้ ช่วงเวลาที่น้อยลงระหว่างจุดจะดีกว่า การปรับปรุงยังสามารถแสดงโดยใช้คุณสมบัติเพิ่มเติม (เช่นความรู้สึกของข่าวสารหรือเหตุการณ์สำคัญที่เกี่ยวข้องกับแต่ละจุดในชุดข้อมูลแม้ว่าจะยากที่จะเขียนโค้ดสำหรับโครงข่ายประสาทเทียม) และการค้นหากริดที่ครอบคลุมสำหรับพารามิเตอร์หลายพารามิเตอร์และการค้นพบสถาปัตยกรรม RNN

นอกจากนี้ยังจำเป็นต้องใช้พลังในการประมวลผลที่มากขึ้น (GPU ที่ทรงพลังเป็นสิ่งจำเป็น) เพื่อทำการทดลองหลาย ๆ อย่างควบคู่กันไปและเพื่อประมวลผลข้อมูลจำนวนมากโดยมีการรวบรวมข้อมูลจำนวนมาก

อ้างอิง:

  • https://www.datacamp.com/community/tutorials/finance-python-trading
  • http://colah.github.io/posts/2015-08-Understand-LSTMs/
  • https://en.wikipedia.org
  • https://www.investopedia.com/
  • https://finance.yahoo.com/
  • http://pytorch.org/

หมายเหตุผู้แต่ง: ฉันขอขอบคุณ Ivan Čapalijaและ Matej Paradžikสำหรับการสนทนาที่สร้างสรรค์และคำแนะนำเกี่ยวกับการเรียนรู้เชิงลึกด้านการเงินซึ่งช่วยฉันในการเขียนบล็อกนี้

ทำความเข้าใจพื้นฐาน

กองทุนป้องกันความเสี่ยงทำงานอย่างไร?

กองทุนป้องกันความเสี่ยงจะระดมทุนจากผู้ลงทุนและนำไปลงทุนในระยะสั้นและระยะยาวหรือในผลิตภัณฑ์ทางการเงินที่แตกต่างกันเพื่อเพิ่มผลกำไรสูงสุด กองทุนป้องกันความเสี่ยงอาศัยกลยุทธ์การลงทุนประเภทต่างๆโดยพยายามหาเงินโดยใช้ประโยชน์จากความไร้ประสิทธิภาพของตลาด

การซื้อขายอัลกอริทึมคืออะไร?

การซื้อขายอัลกอริทึมเป็นวิธีการใช้คอมพิวเตอร์เพื่อทำกำไรโดยอัตโนมัติโดยใช้กฎที่อนุมานจากโมเดลการเรียนรู้ของเครื่องหรือกฎที่เขียนด้วยลายมือ

การเรียนรู้เชิงลึกด้านการเงินคืออะไร?

การเรียนรู้เชิงลึกเป็นส่วนหนึ่งของการเรียนรู้ของเครื่องที่เรียนรู้การนำเสนอข้อมูล การเงินคือการบริหารเงิน การเรียนรู้เชิงลึกด้านการเงินคือการประยุกต์ใช้เทคโนโลยีการเรียนรู้เชิงลึกในสาขาการเงิน

ทำไมคุณต้องอัพเกรดเป็น Java 8 อยู่แล้ว

ส่วนหน้าของเว็บ

ทำไมคุณต้องอัพเกรดเป็น Java 8 อยู่แล้ว
ปาร์ตี้ยังไม่จบ: เจาะลึกว่าทำไมยูนิคอร์นถึงเด้งกลับในปี 2560

ปาร์ตี้ยังไม่จบ: เจาะลึกว่าทำไมยูนิคอร์นถึงเด้งกลับในปี 2560

นักลงทุนและเงินทุน

โพสต์ยอดนิยม
Buggy CakePHP Code: 6 ข้อผิดพลาดที่พบบ่อยที่สุดนักพัฒนา CakePHP ทำ
Buggy CakePHP Code: 6 ข้อผิดพลาดที่พบบ่อยที่สุดนักพัฒนา CakePHP ทำ
รีวิว CakePHP 3 ของฉัน - ยังสดยังร้อน
รีวิว CakePHP 3 ของฉัน - ยังสดยังร้อน
ภาพรวมของตัวสร้างไซต์คงที่ยอดนิยม
ภาพรวมของตัวสร้างไซต์คงที่ยอดนิยม
นักพัฒนาชาวโบลิเวีย Yasett Acurana ได้รับทุนการศึกษา ApeeScape ครั้งที่หก
นักพัฒนาชาวโบลิเวีย Yasett Acurana ได้รับทุนการศึกษา ApeeScape ครั้งที่หก
การเขียนโปรแกรมจำนวนเต็มผสม: คู่มือสำหรับการตัดสินใจเชิงคำนวณ
การเขียนโปรแกรมจำนวนเต็มผสม: คู่มือสำหรับการตัดสินใจเชิงคำนวณ
 
แนวโน้มอีคอมเมิร์ซที่โดดเด่นและอิทธิพลต่อการออกแบบ (พร้อมอินโฟกราฟิก)
แนวโน้มอีคอมเมิร์ซที่โดดเด่นและอิทธิพลต่อการออกแบบ (พร้อมอินโฟกราฟิก)
การสำรวจเครื่องมือการทำแผนที่ออนไลน์ที่ดีที่สุดสำหรับนักพัฒนาเว็บ: Roadmap to Roadmaps
การสำรวจเครื่องมือการทำแผนที่ออนไลน์ที่ดีที่สุดสำหรับนักพัฒนาเว็บ: Roadmap to Roadmaps
GraphQL กับ REST - บทช่วยสอน GraphQL
GraphQL กับ REST - บทช่วยสอน GraphQL
ปรับปรุงการแปลงค่าเฉลี่ยเชิงปริมาณเฉลี่ยต่อเนื่อง
ปรับปรุงการแปลงค่าเฉลี่ยเชิงปริมาณเฉลี่ยต่อเนื่อง
ข้อมูลขนาดใหญ่: ใบสั่งยาสำหรับสภาพการวิจัยและพัฒนาเภสัชกรรม
ข้อมูลขนาดใหญ่: ใบสั่งยาสำหรับสภาพการวิจัยและพัฒนาเภสัชกรรม
โพสต์ยอดนิยม
  • วิธีการเขียนภาษาสคริปต์
  • ตัวอย่างตัวชี้วัดประสิทธิภาพหลัก การจัดการโครงการ
  • ตัวอย่างการตรวจสอบฟอร์มเชิงมุม 4
  • วิธีการทดสอบการใช้งาน
  • วิธีถอดรหัสรหัส PIN ของบัตรเครดิต
  • มอนติคาร์โลแบบจำลองการเงินจำลอง
  • จะได้รับการรับรองจาก aws ได้อย่างไร
หมวดหมู่
  • กระบวนการและเครื่องมือ
  • การวางแผนและการพยากรณ์
  • การออกแบบ Ui
  • การจัดการโครงการ
  • © 2022 | สงวนลิขสิทธิ์

    portaldacalheta.pt