portaldacalheta.pt
  • หลัก
  • การจัดการโครงการ
  • การเพิ่มขึ้นของระยะไกล
  • การบริหารโครงการ
  • เครื่องมือและบทช่วยสอน
เทคโนโลยี

ดาวที่กำหนดตำแหน่ง: การปรับปรุงระบบการจัดอันดับ IMDb



นักดูหนังบางครั้งใช้การจัดอันดับเพื่อเลือกสิ่งที่จะดู เมื่อทำสิ่งนี้ด้วยตัวเองแล้วฉันสังเกตเห็นว่าภาพยนตร์ที่ติดอันดับดีที่สุดหลายเรื่องเป็นประเภทเดียวกัน: ละคร สิ่งนี้ทำให้ฉันคิดว่าการจัดอันดับอาจมีอคติประเภทใดประเภทหนึ่ง

ฉันอยู่ในไซต์ยอดนิยมแห่งหนึ่งสำหรับคนรักภาพยนตร์ IMDb ซึ่งครอบคลุมภาพยนตร์จากทั่วทุกมุมโลกและจากทุกปี การจัดอันดับที่มีชื่อเสียงนั้นมาจากการรวบรวมบทวิจารณ์จำนวนมาก สำหรับการวิเคราะห์ข้อมูล IMDb นี้ฉันตัดสินใจดาวน์โหลดข้อมูลทั้งหมดที่มีเพื่อวิเคราะห์และพยายามสร้างการจัดอันดับใหม่ที่ละเอียดอ่อนซึ่งจะพิจารณาเกณฑ์ที่กว้างขึ้น



คืออุตสาหกรรมดนตรีที่กำลังเติบโต

ระบบการให้คะแนน IMDb: การกรองข้อมูลของ IMDb

ฉันสามารถดาวน์โหลดข้อมูลเกี่ยวกับภาพยนตร์ 242,528 เรื่องที่ออกระหว่างปี 1970 ถึง 2019 ได้ ข้อมูลที่ IMDb ให้ฉันสำหรับแต่ละคนคือ: Rank, Title, ID, Year, Certificate, Rating, Votes, Metascore, Synopsis, Runtime, Genre, Gross และ SearchYear.



เพื่อให้มีข้อมูลเพียงพอในการวิเคราะห์ฉันต้องการจำนวนบทวิจารณ์ขั้นต่ำต่อหนึ่งเรื่องดังนั้นสิ่งแรกที่ฉันทำคือการกรองภาพยนตร์ที่มีบทวิจารณ์น้อยกว่า 500 รายการ สิ่งนี้ส่งผลให้มีภาพยนตร์ 33,296 เรื่องและในตารางถัดไปเราจะเห็นการวิเคราะห์โดยสรุปของฟิลด์ต่างๆ:



ฟิลด์ ประเภท จำนวน Null ค่าเฉลี่ย ค่ามัธยฐาน
อันดับ ปัจจัย 0
หัวข้อ ปัจจัย 0
ID ปัจจัย 0
ปี Int 0 พ.ศ. 2546 พ.ศ. 2549
ใบรับรอง ปัจจัย 17587
คะแนน Int 0 6.1 6.3
โหวต Int 0 21040 2560
Metascore Int 22350 55.3 56
เรื่องย่อ ปัจจัย 0
รันไทม์ Int 132 104.9 100
ประเภท ปัจจัย 0
ขั้นต้น ปัจจัย 21415
ค้นหาปี Int 0 พ.ศ. 2546 พ.ศ. 2549

หมายเหตุ: ใน ร , Factor หมายถึงสตริง Rank และ Gross เป็นวิธีดังกล่าวในชุดข้อมูล IMDb ดั้งเดิมเนื่องจากมีตัวคั่นหลายพันตัว

ก่อนที่จะเริ่มปรับแต่งคะแนนฉันต้องวิเคราะห์ชุดข้อมูลนี้เพิ่มเติม สำหรับผู้เริ่มต้นฟิลด์ Certificate, Metascore และ Gross มีมากกว่า 50% ของค่าว่างดังนั้นจึงไม่มีประโยชน์ อันดับขึ้นอยู่กับการให้คะแนน (ตัวแปรที่จะปรับแต่ง) ดังนั้นจึงไม่มีข้อมูลที่เป็นประโยชน์ เช่นเดียวกับ ID ซึ่งเป็นตัวระบุเฉพาะสำหรับภาพยนตร์แต่ละเรื่อง



สุดท้าย Title และ Synopsis เป็นช่องข้อความสั้น ๆ อาจเป็นไปได้ที่จะใช้ผ่านเทคนิค NLP บางอย่าง แต่เนื่องจากข้อความมีจำนวน จำกัด ฉันจึงตัดสินใจที่จะไม่นำสิ่งเหล่านี้มาพิจารณาในงานนี้

หลังจากตัวกรองแรกนี้ฉันเหลือ Genre, Rating, Year, Votes, SearchYear และ Runtime ใน Genre มีมากกว่าหนึ่งประเภทต่อภาพยนตร์โดยคั่นด้วยเครื่องหมายจุลภาค ดังนั้นเพื่อจับเอฟเฟกต์เพิ่มเติมของการมีหลายประเภทฉันจึงเปลี่ยนมันโดยใช้ การเข้ารหัสแบบ one-hot . สิ่งนี้ทำให้เกิดช่องบูลีนใหม่ 22 ช่องสำหรับแต่ละประเภทโดยมีค่า 1 หากภาพยนตร์มีประเภทนี้หรือ 0 เป็นอย่างอื่น



การวิเคราะห์ข้อมูล IMDb

เพื่อดูความสัมพันธ์ระหว่างตัวแปรฉันคำนวณ เมทริกซ์สหสัมพันธ์ .

เมทริกซ์สหสัมพันธ์ระหว่างคอลัมน์ดั้งเดิมที่เหลือทั้งหมดและคอลัมน์ประเภทใหม่ ตัวเลขที่ใกล้เคียงกับศูนย์ส่งผลให้เกิดช่องว่างในตาราง ความสัมพันธ์เชิงลบทำให้เกิดจุดสีแดงและความสัมพันธ์เชิงบวกในจุดสีน้ำเงิน จุดมีขนาดใหญ่ขึ้นและเข้มขึ้นความสัมพันธ์ก็ยิ่งมากขึ้นเท่านั้น (ไฮไลต์ภาพอธิบายไว้ในข้อความบทความหลัก)



ในที่นี้ค่าที่ใกล้เคียงกับ 1 แสดงถึงความสัมพันธ์เชิงบวกที่แข็งแกร่งและค่าใกล้กับ -1 ซึ่งเป็นความสัมพันธ์เชิงลบที่แข็งแกร่ง จากกราฟนี้ฉันได้สังเกตหลายอย่าง:

  • Year และ SearchYear มีความสัมพันธ์กันอย่างแน่นอน ซึ่งหมายความว่ามันอาจจะมีค่าเหมือนกันและการมีทั้งสองนั้นเหมือนกับการมีเพียงค่าเดียวดังนั้นฉันจึงเก็บไว้เพียง Year
  • บางฟิลด์คาดว่าจะมีความสัมพันธ์เชิงบวกเช่น:
    • Music ด้วย Musical
    • Action ด้วย Adventure
    • Animation ด้วย Adventure
  • เหมือนกันสำหรับความสัมพันธ์เชิงลบ:
    • Drama เทียบกับ Horror
    • Comedy เทียบกับ Horror
    • Horror เทียบกับ Romance
  • เกี่ยวข้องกับตัวแปรสำคัญ (Rating) ฉันสังเกตเห็น:
    • มีความสัมพันธ์เชิงบวกและสำคัญกับ Runtime และ Drama.
    • มีความสัมพันธ์ต่ำกว่า Votes, Biography และ History
    • มีความสัมพันธ์เชิงลบอย่างมากกับ Horror และค่าลบที่ต่ำกว่าด้วย Thriller, Action, Sci-Fi และ Year
    • ไม่มีความสัมพันธ์ที่สำคัญอื่นใด

ดูเหมือนว่าละครเรื่องยาวจะได้รับการจัดอันดับที่ดีในขณะที่ภาพยนตร์สยองขวัญสั้น ๆ ไม่ได้รับความนิยม ในความคิดของฉันฉันไม่มีข้อมูลที่จะตรวจสอบ - มันไม่ได้สัมพันธ์กับประเภทของภาพยนตร์ที่สร้างผลกำไรมากกว่าเช่นภาพยนตร์ Marvel หรือ Pixar



อาจเป็นไปได้ว่าผู้ที่ลงคะแนนในเว็บไซต์นี้ไม่ใช่ตัวแทนที่ดีที่สุดของเกณฑ์ของคนทั่วไป เป็นเรื่องที่สมเหตุสมผลเนื่องจากผู้ที่ใช้เวลาในการส่งบทวิจารณ์บนไซต์อาจเป็นนักวิจารณ์ภาพยนตร์บางประเภทที่มีเกณฑ์เฉพาะเจาะจงมากกว่า อย่างไรก็ตามวัตถุประสงค์ของฉันคือการลบเอฟเฟกต์ของคุณสมบัติทั่วไปของภาพยนตร์ดังนั้นฉันจึงพยายามลบอคตินี้ในกระบวนการ

การกระจายประเภทในระบบการจัดอันดับ IMDb

ขั้นตอนต่อไปคือการวิเคราะห์การกระจายของแต่ละประเภทในการให้คะแนน ในการทำเช่นนั้นฉันได้สร้างฟิลด์ใหม่ชื่อ Principal_Genre อิงจากประเภทแรกที่ปรากฏในต้นฉบับ Genre ฟิลด์ เพื่อให้เห็นภาพนี้ฉันได้สร้างไฟล์ กราฟไวโอลิน .



พล็อตไวโอลินแสดงการกระจายคะแนนสำหรับแต่ละประเภท

ปัญญาประดิษฐ์กับเศรษฐกิจ

อีกครั้งฉันเห็นว่า Drama สัมพันธ์กับการให้คะแนนสูงและ Horror ด้วยต่ำกว่า อย่างไรก็ตามกราฟนี้ยังเปิดเผยประเภทอื่น ๆ ที่มีคะแนนดี: Biography และ Animation. ความสัมพันธ์ของพวกเขาไม่ปรากฏในเมทริกซ์ก่อนหน้านี้อาจเป็นเพราะมีภาพยนตร์ประเภทนี้น้อยเกินไป ต่อไปฉันสร้างพล็อตแถบความถี่ตามประเภท

กราฟแท่งแสดงจำนวนภาพยนตร์แต่ละประเภทในฐานข้อมูล ตลกดราม่าและแอ็คชั่นมีความถี่ประมาณ 6,000 หรือสูงกว่า; อาชญากรรมและความสยองขวัญอยู่เหนือ 2,000; ส่วนที่เหลือต่ำกว่า 1,000

อย่างมีประสิทธิภาพ, Biography และ Animation มีภาพยนตร์น้อยมากเช่นเดียวกับ Sport และ Adult. ด้วยเหตุนี้จึงไม่ค่อยมีความสัมพันธ์กับ Rating

ตัวแปรอื่น ๆ ใน IMDb Rating System

หลังจากนั้นฉันก็เริ่มวิเคราะห์ความแปรปรวนร่วมต่อเนื่อง: Year, Votes และ Runtime ในพล็อตการกระจายคุณสามารถดูความสัมพันธ์ระหว่าง Rating และ Year.

พล็อตการจัดอันดับและปีที่กระจาย

อย่างที่เราเห็นก่อนหน้านี้ Year ดูเหมือนว่าจะมีความสัมพันธ์เชิงลบกับ Rating: เมื่อปีที่เพิ่มขึ้นความแปรปรวนของการจัดอันดับก็เพิ่มขึ้นเช่นกันทำให้มีค่าเชิงลบมากขึ้นในภาพยนตร์ใหม่ ๆ

ต่อไปฉันสร้างพล็อตเดียวกันสำหรับ Votes

พล็อตการจัดอันดับและคะแนนที่กระจาย

ที่นี่ความสัมพันธ์ชัดเจนยิ่งขึ้น: ยิ่งจำนวนโหวตสูงอันดับก็จะยิ่งสูงขึ้น อย่างไรก็ตามภาพยนตร์ส่วนใหญ่มีคะแนนโหวตไม่มากนักและในกรณีนี้ Rating มีความแปรปรวนมากขึ้น

สุดท้ายฉันดูความสัมพันธ์กับ Runtime.

พล็อตการกระจายระหว่างเรตติ้งและรันไทม์

อีกครั้งเรามีรูปแบบที่คล้ายกัน แต่แข็งแกร่งกว่า: เวลาทำงานที่สูงขึ้นหมายถึงการให้คะแนนที่สูงขึ้น แต่มีบางกรณีที่เวลาทำงานสูง

การปรับแต่งระบบการให้คะแนน IMDb

หลังจากการวิเคราะห์ทั้งหมดนี้ฉันมีความคิดที่ดีขึ้นเกี่ยวกับข้อมูลที่ฉันกำลังจัดการอยู่ดังนั้นฉันจึงตัดสินใจทดสอบแบบจำลองบางอย่างเพื่อคาดการณ์การให้คะแนนตามช่องเหล่านี้ ความคิดของฉันคือความแตกต่างระหว่างการทำนายแบบจำลองที่ดีที่สุดของฉันกับของจริง Rating จะลบอิทธิพลของคุณลักษณะทั่วไปและสะท้อนถึงลักษณะเฉพาะที่ทำให้ภาพยนตร์ดีกว่าเรื่องอื่น ๆ

ฉันเริ่มต้นด้วยโมเดลที่ง่ายที่สุดนั่นคือเส้นตรง เพื่อประเมินว่าโมเดลใดทำงานได้ดีกว่าฉันสังเกตรูท - ค่าเฉลี่ย - กำลังสอง ( RMSE ) และค่าเฉลี่ยสัมบูรณ์ ( มาก ) ข้อผิดพลาด เป็นมาตรการมาตรฐานสำหรับงานประเภทนี้ นอกจากนี้ยังอยู่ในระดับเดียวกับตัวแปรที่คาดการณ์ไว้ดังนั้นจึงง่ายต่อการตีความ

ในรุ่นแรกนี้ RMSE คือ 1.03 และ MAE 0.78 แต่แบบจำลองเชิงเส้นจะให้ความเป็นอิสระเหนือข้อผิดพลาดค่ามัธยฐานของศูนย์และความแปรปรวนคงที่ หากถูกต้องกราฟ“ ค่าคงเหลือเทียบกับค่าที่คาดการณ์” ควรมีลักษณะเหมือนก้อนเมฆที่ไม่มีโครงสร้าง ผมจึงตัดสินใจสร้างกราฟเพื่อยืนยันว่า

ค่าที่เหลือเทียบกับค่าที่คาดการณ์ scatterplot

ฉันเห็นว่าค่าที่คาดการณ์ไว้มากถึง 7 ค่ามันมีรูปร่างที่ไม่เป็นโครงสร้าง แต่หลังจากค่านี้มันมีรูปร่างเชื้อสายเชิงเส้นที่ชัดเจน ดังนั้นการคาดการณ์ของโมเดลจึงไม่ดีและฉันมี 'ล้น' ในค่าที่คาดการณ์ไว้เพราะในความเป็นจริง Rating ต้องไม่เกิน 10

ในการวิเคราะห์ข้อมูล IMDb ก่อนหน้านี้ด้วยจำนวน Votes, Rating ปรับปรุง; อย่างไรก็ตามเหตุการณ์นี้เกิดขึ้นไม่กี่กรณีและด้วยคะแนนเสียงจำนวนมาก ซึ่งอาจทำให้เกิดความผิดเพี้ยนในแบบจำลองและสร้าง Rating ล้น. เพื่อตรวจสอบสิ่งนี้ฉันได้ประเมินสิ่งที่จะเกิดขึ้นกับโมเดลเดียวกันนี้โดยลบ Votes ฟิลด์

nodejs ใช้สำหรับอะไร

ค่าที่เหลือเทียบกับค่าที่คาดการณ์จะกระจายพล็อตเมื่อช่องโหวตถูกลบออก

ดีขึ้นมาก! มีรูปร่างที่ชัดเจนและไม่มีโครงสร้างโดยไม่มีค่าที่คาดการณ์มากเกินไป Votes นอกจากนี้ยังขึ้นอยู่กับกิจกรรมของผู้ตรวจสอบและไม่ใช่คุณลักษณะของภาพยนตร์ดังนั้นฉันจึงตัดสินใจทิ้งฟิลด์นี้ด้วยเช่นกัน ข้อผิดพลาดหลังจากลบออกคือ 1.06 บน RMSE และ 0.81 ใน MAE ซึ่งแย่ลงเล็กน้อย แต่ไม่มากนักและฉันต้องการให้มีการสนับสนุนและการเลือกคุณสมบัติที่ดีกว่าประสิทธิภาพที่ดีกว่าเล็กน้อยในชุดการฝึกของฉัน

การวิเคราะห์ข้อมูล IMDb: โมเดลอื่น ๆ ทำงานได้ดีแค่ไหน?

สิ่งต่อไปที่ฉันทำคือลองใช้โมเดลต่างๆเพื่อวิเคราะห์ว่าตัวไหนทำงานได้ดีกว่า สำหรับแต่ละรุ่นฉันใช้ไฟล์ การค้นหาแบบสุ่ม เทคนิคการปรับค่าไฮเปอร์พารามิเตอร์และ 5 เท่า การตรวจสอบข้าม เพื่อป้องกันความลำเอียงของโมเดล ในตารางต่อไปนี้เป็นข้อผิดพลาดโดยประมาณที่ได้รับ:

รุ่น RMSE มาก
โครงข่ายประสาท 1.044596 0.795699
การส่งเสริม 1.046639 0.7971921
ต้นไม้อนุมาน 1.05704 0.8054783
เกม 1.0615108 0.8119555
แบบจำลองเชิงเส้น 1.066539 0.8152524
Reg. เชิงเส้นที่ถูกลงโทษ 1.066607 0.8153331
เคเอ็น 1.066714 0.8123369
Bayesian Ridge 1.068995 0.8148692
SVM 1.073491 0.8092725

อย่างที่คุณเห็นโมเดลทั้งหมดทำงานคล้ายกันดังนั้นฉันจึงใช้บางรุ่นเพื่อวิเคราะห์ข้อมูลเพิ่มเติมเล็กน้อย ฉันต้องการทราบอิทธิพลของแต่ละช่องที่มีต่อการให้คะแนน วิธีที่ง่ายที่สุดคือการสังเกตพารามิเตอร์ของแบบจำลองเชิงเส้น แต่เพื่อหลีกเลี่ยงความผิดเพี้ยนก่อนหน้านี้ฉันได้ปรับขนาดข้อมูลแล้วฝึกโมเดลเชิงเส้นอีกครั้ง น้ำหนักดังภาพที่นี่

กราฟแท่งของน้ำหนักแบบจำลองเชิงเส้นตั้งแต่เกือบ -0.25 สำหรับ Horror ไปจนถึงเกือบ 0.25 สำหรับ Drama

ในกราฟนี้เห็นได้ชัดว่าตัวแปรที่สำคัญที่สุด 2 ตัวแปรคือ Horror และ Drama โดยที่อันดับแรกมีผลกระทบเชิงลบต่ออันดับและครั้งที่สองเป็นเชิงบวก นอกจากนี้ยังมีสาขาอื่น ๆ ที่ส่งผลในเชิงบวกเช่น Animation และ Biography - ในขณะที่ Action, Sci-Fi และ Year ส่งผลกระทบในทางลบ ยิ่งไปกว่านั้น Principal_Genre ไม่มีผลกระทบมากนักดังนั้นประเภทของภาพยนตร์จึงมีความสำคัญมากกว่าประเภทใดเป็นหลัก

กฎเกสตัลต์ของ ________ บอกว่าเรามักจะจัดกลุ่มวัตถุที่อยู่ใกล้กัน

ด้วยรูปแบบการเพิ่มทั่วไป (GAM) ฉันยังสามารถเห็นผลกระทบโดยละเอียดมากขึ้นสำหรับตัวแปรต่อเนื่องซึ่งในกรณีนี้คือ Year

กราฟของปีเทียบกับ s (ปี) โดยใช้แบบจำลองสารเติมแต่งทั่วไป ค่า s (ปี) เป็นไปตามเส้นโค้งที่เริ่มขึ้นใกล้ 0.6 ในปี 1970 โดยมีจุดต่ำสุดต่ำกว่า 0 ในปี 2010 และเพิ่มขึ้นเป็นใกล้ 0 อีกครั้งภายในปี 2019

ที่นี่เรามีสิ่งที่น่าสนใจมากขึ้น แม้ว่าจะเป็นเรื่องจริงสำหรับภาพยนตร์ล่าสุดเรทติ้งมักจะต่ำกว่า แต่ผลกระทบก็ไม่คงที่ มีค่าต่ำสุดในปี 2010 และดูเหมือนว่าจะ 'กู้คืน' มันเป็นเรื่องที่น่าสนใจหากพบว่าเกิดอะไรขึ้นหลังจากปีนั้นในการผลิตภาพยนตร์ที่อาจทำให้เกิดการเปลี่ยนแปลงนี้

รุ่นที่ดีที่สุดคือ โครงข่ายประสาท ซึ่งมี RMSE และ MAE ต่ำที่สุด แต่อย่างที่คุณเห็นไม่มีรุ่นใดที่มีประสิทธิภาพที่สมบูรณ์แบบ แต่นี่ไม่ใช่ข่าวร้ายในแง่ของวัตถุประสงค์ของฉัน ข้อมูลที่มีให้ฉันประมาณประสิทธิภาพได้ดี แต่ก็ไม่เพียงพอ มีข้อมูลอื่น ๆ ที่ฉันไม่สามารถหาได้จาก IMDb ซึ่งกำลังสร้าง Rating แตกต่างจากคะแนนที่คาดหวังตาม Genre, Runtime และ Year อาจเป็นการแสดงของนักแสดงบทภาพยนตร์การถ่ายภาพหรืออื่น ๆ อีกมากมาย

จากมุมมองของฉันลักษณะอื่น ๆ เหล่านี้เป็นสิ่งสำคัญอย่างยิ่งในการเลือกสิ่งที่จะดู ฉันไม่สนใจว่าภาพยนตร์เรื่องนั้น ๆ จะเป็นแนวดราม่าแอคชั่นหรือนิยายวิทยาศาสตร์ ฉันอยากให้มันมีอะไรพิเศษบางอย่างที่ทำให้ฉันมีช่วงเวลาที่ดีทำให้ฉันได้เรียนรู้อะไรบางอย่างทำให้ฉันสะท้อนความเป็นจริงหรือแค่ให้ความบันเทิงกับฉัน

ดังนั้นฉันจึงสร้างการจัดอันดับใหม่ที่ละเอียดอ่อนโดยใช้คะแนน IMDb และลบคะแนนที่คาดการณ์ไว้ของโมเดลที่ดีที่สุด การทำเช่นนี้ฉันกำลังลบเอฟเฟกต์ของ Genre, Runtime และ Year และการเก็บรักษาข้อมูลอื่น ๆ ที่ไม่รู้จักซึ่งสำคัญกว่าสำหรับฉันมาก

ทางเลือกของระบบการจัดอันดับ IMDb: ผลลัพธ์สุดท้าย

ตอนนี้เรามาดูกันดีกว่าว่า 10 ภาพยนตร์ที่ดีที่สุดจากการจัดอันดับใหม่ของฉันเทียบกับคะแนน IMDb จริง:

ไอเอ็ม

หัวข้อ ประเภท คะแนน IMDb คะแนนกลั่น
ใครร้องเพลงที่นั่น ผจญภัย, ตลก, ดราม่า 8.9 1.90
ดิปูหมายเลข 2 การผจญภัยครอบครัว 8.9 3.14
เดอะลอร์ดออฟเดอะริง: การกลับมาของราชา ผจญภัยดราม่าแฟนตาซี 8.9 2.67
เดอะลอร์ดออฟเดอะริงส์: มิตรภาพแห่งแหวน ผจญภัยดราม่าแฟนตาซี 8.8 2.55
Anbe Sivam ผจญภัย, ตลก, ดราม่า 8.8 2.38
คลาส Hababam ในวันหยุด ผจญภัย, ตลก, ดราม่า 8.7 1.66
ลอร์ดออฟเดอะริง: หอคอยสองแห่ง ผจญภัยดราม่าแฟนตาซี 8.7 2.46
Mudras โทร การผจญภัยดราม่าโรแมนติก 8.7 2.34
Interstellar Adventure, Drama, Sci-Fi 8.6 2.83
กลับไปสู่อนาคต Adventure, Comedy, Sci-Fi 8.5 2.32

ของฉัน

หัวข้อ ประเภท คะแนน IMDb คะแนนกลั่น
ดิปูหมายเลข 2 การผจญภัยครอบครัว 8.9 3.14
Interstellar Adventure, Drama, Sci-Fi 8.6 2.83
เดอะลอร์ดออฟเดอะริง: การกลับมาของราชา ผจญภัยดราม่าแฟนตาซี 8.9 2.67
เดอะลอร์ดออฟเดอะริงส์: มิตรภาพแห่งแหวน ผจญภัยดราม่าแฟนตาซี 8.8 2.55
Kolah Ghermezi ไปชั่งน้ำหนัก Khale ผจญภัย, ตลก, ครอบครัว 8.1 2.49
ลอร์ดออฟเดอะริง: หอคอยสองแห่ง ผจญภัยดราม่าแฟนตาซี 8.7 2.46
Anbe Sivam ผจญภัย, ตลก, ดราม่า 8.8 2.38
อัศวินโต๊ะเหลี่ยม ผจญภัยตลกแฟนตาซี 8.2 2.35
Mudras โทร การผจญภัยดราม่าโรแมนติก 8.7 2.34
กลับไปสู่อนาคต Adventure, Comedy, Sci-Fi 8.5 2.32

อย่างที่คุณเห็นแท่นไม่ได้เปลี่ยนแปลงอย่างรุนแรง คาดว่าเป็นเพราะ RMSE ไม่สูงนักและที่นี่เรากำลังดูด้านบน มาดูกันว่าเกิดอะไรขึ้นกับ 10 อันดับสุดท้าย:

ไอเอ็ม

หัวข้อ ประเภท คะแนน IMDb คะแนนกลั่น
มันเกิดขึ้นในวันพรุ่งนี้ - แท็บลอยด์ขนาดใหญ่ ตลกลึกลับ หนึ่ง -4.86
Cumali Ceber: ขออัลเลาะห์พาคุณไป ตลก หนึ่ง -4.57
บาดัง ตลกแฟนตาซี หนึ่ง -4.74
ยัยกรีก !!! การเสนอชื่อจักรวาล ตลก 1.1 -4.52
ภูมิใจอเมริกัน ละคร 1.1 -5.49
Browncoats: สงครามอิสรภาพ แอ็คชั่นไซไฟสงคราม 1.1 -3.71
วันหยุดสุดสัปดาห์มันมีชีวิตอยู่ ตลกสยองขวัญลึกลับ 1.2 -4.53
Bolívar: ฮีโร่ แอนิเมชันชีวประวัติ 1.2 -5.34
การเพิ่มขึ้นของค้างคาวดำ แอ็คชั่นไซไฟ 1.2 -3.65
Hatsukoi ละคร 1.2 -5.38

ของฉัน

หัวข้อ ประเภท คะแนน IMDb คะแนนกลั่น
ภูมิใจอเมริกัน ละคร 1.1 -5.49
ซานต้าและกระต่ายไอศครีม ครอบครัวแฟนตาซี 1.3 -5.42
Hatsukoi ละคร 1.2 -5.38
การเดินทาง ชีวประวัติละคร 1.5 -5.35
Bolívar: ฮีโร่ แอนิเมชันชีวประวัติ 1.2 -5.34
Hanum & Rangga: ศรัทธาและเมือง ดราม่าโรแมนติก 1.2 -5.28
หลังจากฤดูกาลที่แล้ว แอนิเมชัน, ดราม่า, ไซไฟ 1.7 -5.27
Barschel Murder ในเจนีวา ละคร 1.6 -5.23
Rasshu raifu ละคร 1.5 -5.08
Kamifûsen ละคร 1.5 -5.08

สิ่งเดียวกันนี้เกิดขึ้นที่นี่ แต่ตอนนี้เราจะเห็นว่ามีละครปรากฏในกรณีที่มีการกลั่นกรองมากกว่าใน IMDb ซึ่งแสดงให้เห็นว่าละครบางเรื่องอาจได้รับการจัดอันดับสูงเกินไปสำหรับการเป็นละครเท่านั้น

Design Thinking สำหรับกลยุทธ์ทางธุรกิจ

บางทีแท่นที่น่าสนใจที่สุดในการดูคือภาพยนตร์ 10 เรื่องที่มีความแตกต่างมากที่สุดระหว่างคะแนนของระบบการให้คะแนน IMDb กับเรื่องที่ฉันได้รับการปรับแต่ง ภาพยนตร์เหล่านี้เป็นภาพยนตร์ที่ให้น้ำหนักกับลักษณะที่ไม่รู้จักและทำให้ภาพยนตร์ดีขึ้น (หรือแย่ลง) มากกว่าที่คาดไว้สำหรับคุณสมบัติที่เป็นที่รู้จัก

หัวข้อ คะแนน IMDb คะแนนกลั่น ความแตกต่าง
Kanashimi no beradonna 7.4 -0.71 8.11
พระเยซูคริสต์ซูเปอร์สตาร์ 7.4 -0.69 8.09
พิงค์ฟลอยด์เดอะวอลล์ 8.1 0.03 8.06
Tenshi no tamago 7.6 -0.42 8.02
จิบอนเทคเนย่า 9.4 1.52 7.87
เต้น 7.8 0.00 7.80
ซานต้าและหมีสามตัว 7.1 -0.70 7.80
เรื่องราวความสุขของ Scrooge 7.5 -0.24 7.74
ผิวตูด 7 -0.74 7.74
พ.ศ. 2319 7.6 -0.11 7.71

ถ้าฉันเป็นผู้กำกับภาพยนตร์และต้องผลิตภาพยนตร์เรื่องใหม่หลังจากทำการวิเคราะห์ข้อมูล IMDb ทั้งหมดนี้ฉันก็มีความคิดที่ดีขึ้นว่าจะสร้างภาพยนตร์ประเภทใดเพื่อให้มีอันดับ IMDb ที่ดีขึ้น มันจะเป็นละครชีวประวัติแอนิเมชั่นเรื่องยาวที่จะนำมารีเมคจากภาพยนตร์เก่าตัวอย่างเช่น Amadeus นี่อาจจะทำให้มั่นใจได้ว่ามีอันดับ IMDb ที่ดี แต่ฉันไม่แน่ใจเกี่ยวกับผลกำไร ...

คุณคิดอย่างไรเกี่ยวกับภาพยนตร์ที่อยู่ในอันดับใหม่นี้? คุณชอบพวกเขาไหม? หรือคุณชอบแบบดั้งเดิมมากกว่ากัน? แจ้งให้เราทราบในความคิดเห็นด้านล่าง!

ทำความเข้าใจพื้นฐาน

IMDb หมายถึงอะไร?

IMDb (ฐานข้อมูลภาพยนตร์ทางอินเทอร์เน็ต) เป็นฐานข้อมูลออนไลน์ของข้อมูลที่เกี่ยวข้องกับเนื้อหาภาพและเสียง

ระบบการให้คะแนน IMDb คืออะไร?

ระบบการให้คะแนน IMDb เป็นวิธีการสั่งซื้อเนื้อหาภาพและเสียงโดยคะแนนที่สร้างขึ้นจากการโหวตของผู้ใช้เว็บ

IMDb เป็นฐานข้อมูลประเภทใด

ข้อมูลหลักของ IMDb เกี่ยวกับภาพยนตร์: พวกเขาเก็บชื่อปีขั้นต้นระยะเวลาประเภทและลักษณะทั่วไปอื่น ๆ

จุดประสงค์ของ IMDb คืออะไร?

จุดประสงค์ของ IMDb คือเป็นสารานุกรมเนื้อหาภาพและเสียงที่ใหญ่ที่สุดและใหญ่ที่สุด

การเรียนรู้ของเครื่องสามารถเพิ่มความปลอดภัยทางไซเบอร์ให้กับรถยนต์ที่เป็นอิสระได้อย่างไร

นวัตกรรม

การเรียนรู้ของเครื่องสามารถเพิ่มความปลอดภัยทางไซเบอร์ให้กับรถยนต์ที่เป็นอิสระได้อย่างไร
วิธีการเป็นที่ปรึกษาทางการเงินที่น่าทึ่ง

วิธีการเป็นที่ปรึกษาทางการเงินที่น่าทึ่ง

กระบวนการทางการเงิน

โพสต์ยอดนิยม
ตลาด Crowdfunding Equity ของสหรัฐมีการเติบโตขึ้นตามความคาดหวังหรือไม่?
ตลาด Crowdfunding Equity ของสหรัฐมีการเติบโตขึ้นตามความคาดหวังหรือไม่?
คู่มือสำคัญสำหรับ Qmake
คู่มือสำคัญสำหรับ Qmake
หลักการออกแบบ Mobile UX
หลักการออกแบบ Mobile UX
MIDI Tutorial: การสร้างแอปพลิเคชั่นเสียงบนเบราว์เซอร์ที่ควบคุมโดยฮาร์ดแวร์ MIDI
MIDI Tutorial: การสร้างแอปพลิเคชั่นเสียงบนเบราว์เซอร์ที่ควบคุมโดยฮาร์ดแวร์ MIDI
Init.js: คำแนะนำเกี่ยวกับสาเหตุและวิธีการใช้ JavaScript แบบ Full-Stack
Init.js: คำแนะนำเกี่ยวกับสาเหตุและวิธีการใช้ JavaScript แบบ Full-Stack
 
Splash of EarlGrey - UI การทดสอบแอพ ApeeScape Talent
Splash of EarlGrey - UI การทดสอบแอพ ApeeScape Talent
จาก Node.js ไปจนถึงการจ่ายภาษีอิสระของคุณ: บทสัมภาษณ์กับ Developer ที่ประสบความสำเร็จ
จาก Node.js ไปจนถึงการจ่ายภาษีอิสระของคุณ: บทสัมภาษณ์กับ Developer ที่ประสบความสำเร็จ
ขายธุรกิจของคุณ? หยุดทิ้งเงินไว้บนโต๊ะ
ขายธุรกิจของคุณ? หยุดทิ้งเงินไว้บนโต๊ะ
บทช่วยสอนเกี่ยวกับส่วนขยายแอป iOS 8
บทช่วยสอนเกี่ยวกับส่วนขยายแอป iOS 8
ผู้จัดการการเติบโต
ผู้จัดการการเติบโต
โพสต์ยอดนิยม
  • ธีมบูตสแตรป css คืออะไร
  • แบบอักษรที่ดีที่สุดสำหรับการออกแบบการพิมพ์
  • นักออกแบบภาพ vs นักออกแบบกราฟิก
  • เรียนรู้ภาษา c/c++
  • บัตรเครดิตที่ถูกแฮ็กด้วยรหัสความปลอดภัย
  • windows รหัสในคืออะไร
หมวดหมู่
  • การจัดการโครงการ
  • การเพิ่มขึ้นของระยะไกล
  • การบริหารโครงการ
  • เครื่องมือและบทช่วยสอน
  • © 2022 | สงวนลิขสิทธิ์

    portaldacalheta.pt