นักดูหนังบางครั้งใช้การจัดอันดับเพื่อเลือกสิ่งที่จะดู เมื่อทำสิ่งนี้ด้วยตัวเองแล้วฉันสังเกตเห็นว่าภาพยนตร์ที่ติดอันดับดีที่สุดหลายเรื่องเป็นประเภทเดียวกัน: ละคร สิ่งนี้ทำให้ฉันคิดว่าการจัดอันดับอาจมีอคติประเภทใดประเภทหนึ่ง
ฉันอยู่ในไซต์ยอดนิยมแห่งหนึ่งสำหรับคนรักภาพยนตร์ IMDb ซึ่งครอบคลุมภาพยนตร์จากทั่วทุกมุมโลกและจากทุกปี การจัดอันดับที่มีชื่อเสียงนั้นมาจากการรวบรวมบทวิจารณ์จำนวนมาก สำหรับการวิเคราะห์ข้อมูล IMDb นี้ฉันตัดสินใจดาวน์โหลดข้อมูลทั้งหมดที่มีเพื่อวิเคราะห์และพยายามสร้างการจัดอันดับใหม่ที่ละเอียดอ่อนซึ่งจะพิจารณาเกณฑ์ที่กว้างขึ้น
คืออุตสาหกรรมดนตรีที่กำลังเติบโต
ฉันสามารถดาวน์โหลดข้อมูลเกี่ยวกับภาพยนตร์ 242,528 เรื่องที่ออกระหว่างปี 1970 ถึง 2019 ได้ ข้อมูลที่ IMDb ให้ฉันสำหรับแต่ละคนคือ: Rank
, Title
, ID
, Year
, Certificate
, Rating
, Votes
, Metascore
, Synopsis
, Runtime
, Genre
, Gross
และ SearchYear
.
เพื่อให้มีข้อมูลเพียงพอในการวิเคราะห์ฉันต้องการจำนวนบทวิจารณ์ขั้นต่ำต่อหนึ่งเรื่องดังนั้นสิ่งแรกที่ฉันทำคือการกรองภาพยนตร์ที่มีบทวิจารณ์น้อยกว่า 500 รายการ สิ่งนี้ส่งผลให้มีภาพยนตร์ 33,296 เรื่องและในตารางถัดไปเราจะเห็นการวิเคราะห์โดยสรุปของฟิลด์ต่างๆ:
ฟิลด์ | ประเภท | จำนวน Null | ค่าเฉลี่ย | ค่ามัธยฐาน |
---|---|---|---|---|
อันดับ | ปัจจัย | 0 | ||
หัวข้อ | ปัจจัย | 0 | ||
ID | ปัจจัย | 0 | ||
ปี | Int | 0 | พ.ศ. 2546 | พ.ศ. 2549 |
ใบรับรอง | ปัจจัย | 17587 | ||
คะแนน | Int | 0 | 6.1 | 6.3 |
โหวต | Int | 0 | 21040 | 2560 |
Metascore | Int | 22350 | 55.3 | 56 |
เรื่องย่อ | ปัจจัย | 0 | ||
รันไทม์ | Int | 132 | 104.9 | 100 |
ประเภท | ปัจจัย | 0 | ||
ขั้นต้น | ปัจจัย | 21415 | ||
ค้นหาปี | Int | 0 | พ.ศ. 2546 | พ.ศ. 2549 |
หมายเหตุ: ใน ร , Factor
หมายถึงสตริง Rank
และ Gross
เป็นวิธีดังกล่าวในชุดข้อมูล IMDb ดั้งเดิมเนื่องจากมีตัวคั่นหลายพันตัว
ก่อนที่จะเริ่มปรับแต่งคะแนนฉันต้องวิเคราะห์ชุดข้อมูลนี้เพิ่มเติม สำหรับผู้เริ่มต้นฟิลด์ Certificate
, Metascore
และ Gross
มีมากกว่า 50% ของค่าว่างดังนั้นจึงไม่มีประโยชน์ อันดับขึ้นอยู่กับการให้คะแนน (ตัวแปรที่จะปรับแต่ง) ดังนั้นจึงไม่มีข้อมูลที่เป็นประโยชน์ เช่นเดียวกับ ID
ซึ่งเป็นตัวระบุเฉพาะสำหรับภาพยนตร์แต่ละเรื่อง
สุดท้าย Title
และ Synopsis
เป็นช่องข้อความสั้น ๆ อาจเป็นไปได้ที่จะใช้ผ่านเทคนิค NLP บางอย่าง แต่เนื่องจากข้อความมีจำนวน จำกัด ฉันจึงตัดสินใจที่จะไม่นำสิ่งเหล่านี้มาพิจารณาในงานนี้
หลังจากตัวกรองแรกนี้ฉันเหลือ Genre
, Rating
, Year
, Votes
, SearchYear
และ Runtime
ใน Genre
มีมากกว่าหนึ่งประเภทต่อภาพยนตร์โดยคั่นด้วยเครื่องหมายจุลภาค ดังนั้นเพื่อจับเอฟเฟกต์เพิ่มเติมของการมีหลายประเภทฉันจึงเปลี่ยนมันโดยใช้ การเข้ารหัสแบบ one-hot . สิ่งนี้ทำให้เกิดช่องบูลีนใหม่ 22 ช่องสำหรับแต่ละประเภทโดยมีค่า 1 หากภาพยนตร์มีประเภทนี้หรือ 0 เป็นอย่างอื่น
เพื่อดูความสัมพันธ์ระหว่างตัวแปรฉันคำนวณ เมทริกซ์สหสัมพันธ์ .
ในที่นี้ค่าที่ใกล้เคียงกับ 1 แสดงถึงความสัมพันธ์เชิงบวกที่แข็งแกร่งและค่าใกล้กับ -1 ซึ่งเป็นความสัมพันธ์เชิงลบที่แข็งแกร่ง จากกราฟนี้ฉันได้สังเกตหลายอย่าง:
Year
และ SearchYear
มีความสัมพันธ์กันอย่างแน่นอน ซึ่งหมายความว่ามันอาจจะมีค่าเหมือนกันและการมีทั้งสองนั้นเหมือนกับการมีเพียงค่าเดียวดังนั้นฉันจึงเก็บไว้เพียง Year
Music
ด้วย Musical
Action
ด้วย Adventure
Animation
ด้วย Adventure
Drama
เทียบกับ Horror
Comedy
เทียบกับ Horror
Horror
เทียบกับ Romance
Rating
) ฉันสังเกตเห็น:Runtime
และ Drama
.Votes
, Biography
และ History
Horror
และค่าลบที่ต่ำกว่าด้วย Thriller
, Action
, Sci-Fi
และ Year
ดูเหมือนว่าละครเรื่องยาวจะได้รับการจัดอันดับที่ดีในขณะที่ภาพยนตร์สยองขวัญสั้น ๆ ไม่ได้รับความนิยม ในความคิดของฉันฉันไม่มีข้อมูลที่จะตรวจสอบ - มันไม่ได้สัมพันธ์กับประเภทของภาพยนตร์ที่สร้างผลกำไรมากกว่าเช่นภาพยนตร์ Marvel หรือ Pixar
อาจเป็นไปได้ว่าผู้ที่ลงคะแนนในเว็บไซต์นี้ไม่ใช่ตัวแทนที่ดีที่สุดของเกณฑ์ของคนทั่วไป เป็นเรื่องที่สมเหตุสมผลเนื่องจากผู้ที่ใช้เวลาในการส่งบทวิจารณ์บนไซต์อาจเป็นนักวิจารณ์ภาพยนตร์บางประเภทที่มีเกณฑ์เฉพาะเจาะจงมากกว่า อย่างไรก็ตามวัตถุประสงค์ของฉันคือการลบเอฟเฟกต์ของคุณสมบัติทั่วไปของภาพยนตร์ดังนั้นฉันจึงพยายามลบอคตินี้ในกระบวนการ
ขั้นตอนต่อไปคือการวิเคราะห์การกระจายของแต่ละประเภทในการให้คะแนน ในการทำเช่นนั้นฉันได้สร้างฟิลด์ใหม่ชื่อ Principal_Genre
อิงจากประเภทแรกที่ปรากฏในต้นฉบับ Genre
ฟิลด์ เพื่อให้เห็นภาพนี้ฉันได้สร้างไฟล์ กราฟไวโอลิน .
ปัญญาประดิษฐ์กับเศรษฐกิจ
อีกครั้งฉันเห็นว่า Drama
สัมพันธ์กับการให้คะแนนสูงและ Horror
ด้วยต่ำกว่า อย่างไรก็ตามกราฟนี้ยังเปิดเผยประเภทอื่น ๆ ที่มีคะแนนดี: Biography
และ Animation
. ความสัมพันธ์ของพวกเขาไม่ปรากฏในเมทริกซ์ก่อนหน้านี้อาจเป็นเพราะมีภาพยนตร์ประเภทนี้น้อยเกินไป ต่อไปฉันสร้างพล็อตแถบความถี่ตามประเภท
อย่างมีประสิทธิภาพ, Biography
และ Animation
มีภาพยนตร์น้อยมากเช่นเดียวกับ Sport
และ Adult
. ด้วยเหตุนี้จึงไม่ค่อยมีความสัมพันธ์กับ Rating
หลังจากนั้นฉันก็เริ่มวิเคราะห์ความแปรปรวนร่วมต่อเนื่อง: Year
, Votes
และ Runtime
ในพล็อตการกระจายคุณสามารถดูความสัมพันธ์ระหว่าง Rating
และ Year
.
อย่างที่เราเห็นก่อนหน้านี้ Year
ดูเหมือนว่าจะมีความสัมพันธ์เชิงลบกับ Rating
: เมื่อปีที่เพิ่มขึ้นความแปรปรวนของการจัดอันดับก็เพิ่มขึ้นเช่นกันทำให้มีค่าเชิงลบมากขึ้นในภาพยนตร์ใหม่ ๆ
ต่อไปฉันสร้างพล็อตเดียวกันสำหรับ Votes
ที่นี่ความสัมพันธ์ชัดเจนยิ่งขึ้น: ยิ่งจำนวนโหวตสูงอันดับก็จะยิ่งสูงขึ้น อย่างไรก็ตามภาพยนตร์ส่วนใหญ่มีคะแนนโหวตไม่มากนักและในกรณีนี้ Rating
มีความแปรปรวนมากขึ้น
สุดท้ายฉันดูความสัมพันธ์กับ Runtime
.
อีกครั้งเรามีรูปแบบที่คล้ายกัน แต่แข็งแกร่งกว่า: เวลาทำงานที่สูงขึ้นหมายถึงการให้คะแนนที่สูงขึ้น แต่มีบางกรณีที่เวลาทำงานสูง
หลังจากการวิเคราะห์ทั้งหมดนี้ฉันมีความคิดที่ดีขึ้นเกี่ยวกับข้อมูลที่ฉันกำลังจัดการอยู่ดังนั้นฉันจึงตัดสินใจทดสอบแบบจำลองบางอย่างเพื่อคาดการณ์การให้คะแนนตามช่องเหล่านี้ ความคิดของฉันคือความแตกต่างระหว่างการทำนายแบบจำลองที่ดีที่สุดของฉันกับของจริง Rating
จะลบอิทธิพลของคุณลักษณะทั่วไปและสะท้อนถึงลักษณะเฉพาะที่ทำให้ภาพยนตร์ดีกว่าเรื่องอื่น ๆ
ฉันเริ่มต้นด้วยโมเดลที่ง่ายที่สุดนั่นคือเส้นตรง เพื่อประเมินว่าโมเดลใดทำงานได้ดีกว่าฉันสังเกตรูท - ค่าเฉลี่ย - กำลังสอง ( RMSE ) และค่าเฉลี่ยสัมบูรณ์ ( มาก ) ข้อผิดพลาด เป็นมาตรการมาตรฐานสำหรับงานประเภทนี้ นอกจากนี้ยังอยู่ในระดับเดียวกับตัวแปรที่คาดการณ์ไว้ดังนั้นจึงง่ายต่อการตีความ
ในรุ่นแรกนี้ RMSE คือ 1.03 และ MAE 0.78 แต่แบบจำลองเชิงเส้นจะให้ความเป็นอิสระเหนือข้อผิดพลาดค่ามัธยฐานของศูนย์และความแปรปรวนคงที่ หากถูกต้องกราฟ“ ค่าคงเหลือเทียบกับค่าที่คาดการณ์” ควรมีลักษณะเหมือนก้อนเมฆที่ไม่มีโครงสร้าง ผมจึงตัดสินใจสร้างกราฟเพื่อยืนยันว่า
ฉันเห็นว่าค่าที่คาดการณ์ไว้มากถึง 7 ค่ามันมีรูปร่างที่ไม่เป็นโครงสร้าง แต่หลังจากค่านี้มันมีรูปร่างเชื้อสายเชิงเส้นที่ชัดเจน ดังนั้นการคาดการณ์ของโมเดลจึงไม่ดีและฉันมี 'ล้น' ในค่าที่คาดการณ์ไว้เพราะในความเป็นจริง Rating
ต้องไม่เกิน 10
ในการวิเคราะห์ข้อมูล IMDb ก่อนหน้านี้ด้วยจำนวน Votes
, Rating
ปรับปรุง; อย่างไรก็ตามเหตุการณ์นี้เกิดขึ้นไม่กี่กรณีและด้วยคะแนนเสียงจำนวนมาก ซึ่งอาจทำให้เกิดความผิดเพี้ยนในแบบจำลองและสร้าง Rating
ล้น. เพื่อตรวจสอบสิ่งนี้ฉันได้ประเมินสิ่งที่จะเกิดขึ้นกับโมเดลเดียวกันนี้โดยลบ Votes
ฟิลด์
nodejs ใช้สำหรับอะไร
ดีขึ้นมาก! มีรูปร่างที่ชัดเจนและไม่มีโครงสร้างโดยไม่มีค่าที่คาดการณ์มากเกินไป Votes
นอกจากนี้ยังขึ้นอยู่กับกิจกรรมของผู้ตรวจสอบและไม่ใช่คุณลักษณะของภาพยนตร์ดังนั้นฉันจึงตัดสินใจทิ้งฟิลด์นี้ด้วยเช่นกัน ข้อผิดพลาดหลังจากลบออกคือ 1.06 บน RMSE และ 0.81 ใน MAE ซึ่งแย่ลงเล็กน้อย แต่ไม่มากนักและฉันต้องการให้มีการสนับสนุนและการเลือกคุณสมบัติที่ดีกว่าประสิทธิภาพที่ดีกว่าเล็กน้อยในชุดการฝึกของฉัน
สิ่งต่อไปที่ฉันทำคือลองใช้โมเดลต่างๆเพื่อวิเคราะห์ว่าตัวไหนทำงานได้ดีกว่า สำหรับแต่ละรุ่นฉันใช้ไฟล์ การค้นหาแบบสุ่ม เทคนิคการปรับค่าไฮเปอร์พารามิเตอร์และ 5 เท่า การตรวจสอบข้าม เพื่อป้องกันความลำเอียงของโมเดล ในตารางต่อไปนี้เป็นข้อผิดพลาดโดยประมาณที่ได้รับ:
รุ่น | RMSE | มาก |
---|---|---|
โครงข่ายประสาท | 1.044596 | 0.795699 |
การส่งเสริม | 1.046639 | 0.7971921 |
ต้นไม้อนุมาน | 1.05704 | 0.8054783 |
เกม | 1.0615108 | 0.8119555 |
แบบจำลองเชิงเส้น | 1.066539 | 0.8152524 |
Reg. เชิงเส้นที่ถูกลงโทษ | 1.066607 | 0.8153331 |
เคเอ็น | 1.066714 | 0.8123369 |
Bayesian Ridge | 1.068995 | 0.8148692 |
SVM | 1.073491 | 0.8092725 |
อย่างที่คุณเห็นโมเดลทั้งหมดทำงานคล้ายกันดังนั้นฉันจึงใช้บางรุ่นเพื่อวิเคราะห์ข้อมูลเพิ่มเติมเล็กน้อย ฉันต้องการทราบอิทธิพลของแต่ละช่องที่มีต่อการให้คะแนน วิธีที่ง่ายที่สุดคือการสังเกตพารามิเตอร์ของแบบจำลองเชิงเส้น แต่เพื่อหลีกเลี่ยงความผิดเพี้ยนก่อนหน้านี้ฉันได้ปรับขนาดข้อมูลแล้วฝึกโมเดลเชิงเส้นอีกครั้ง น้ำหนักดังภาพที่นี่
ในกราฟนี้เห็นได้ชัดว่าตัวแปรที่สำคัญที่สุด 2 ตัวแปรคือ Horror
และ Drama
โดยที่อันดับแรกมีผลกระทบเชิงลบต่ออันดับและครั้งที่สองเป็นเชิงบวก นอกจากนี้ยังมีสาขาอื่น ๆ ที่ส่งผลในเชิงบวกเช่น Animation
และ Biography
- ในขณะที่ Action
, Sci-Fi
และ Year
ส่งผลกระทบในทางลบ ยิ่งไปกว่านั้น Principal_Genre
ไม่มีผลกระทบมากนักดังนั้นประเภทของภาพยนตร์จึงมีความสำคัญมากกว่าประเภทใดเป็นหลัก
กฎเกสตัลต์ของ ________ บอกว่าเรามักจะจัดกลุ่มวัตถุที่อยู่ใกล้กัน
ด้วยรูปแบบการเพิ่มทั่วไป (GAM) ฉันยังสามารถเห็นผลกระทบโดยละเอียดมากขึ้นสำหรับตัวแปรต่อเนื่องซึ่งในกรณีนี้คือ Year
ที่นี่เรามีสิ่งที่น่าสนใจมากขึ้น แม้ว่าจะเป็นเรื่องจริงสำหรับภาพยนตร์ล่าสุดเรทติ้งมักจะต่ำกว่า แต่ผลกระทบก็ไม่คงที่ มีค่าต่ำสุดในปี 2010 และดูเหมือนว่าจะ 'กู้คืน' มันเป็นเรื่องที่น่าสนใจหากพบว่าเกิดอะไรขึ้นหลังจากปีนั้นในการผลิตภาพยนตร์ที่อาจทำให้เกิดการเปลี่ยนแปลงนี้
รุ่นที่ดีที่สุดคือ โครงข่ายประสาท ซึ่งมี RMSE และ MAE ต่ำที่สุด แต่อย่างที่คุณเห็นไม่มีรุ่นใดที่มีประสิทธิภาพที่สมบูรณ์แบบ แต่นี่ไม่ใช่ข่าวร้ายในแง่ของวัตถุประสงค์ของฉัน ข้อมูลที่มีให้ฉันประมาณประสิทธิภาพได้ดี แต่ก็ไม่เพียงพอ มีข้อมูลอื่น ๆ ที่ฉันไม่สามารถหาได้จาก IMDb ซึ่งกำลังสร้าง Rating
แตกต่างจากคะแนนที่คาดหวังตาม Genre
, Runtime
และ Year
อาจเป็นการแสดงของนักแสดงบทภาพยนตร์การถ่ายภาพหรืออื่น ๆ อีกมากมาย
จากมุมมองของฉันลักษณะอื่น ๆ เหล่านี้เป็นสิ่งสำคัญอย่างยิ่งในการเลือกสิ่งที่จะดู ฉันไม่สนใจว่าภาพยนตร์เรื่องนั้น ๆ จะเป็นแนวดราม่าแอคชั่นหรือนิยายวิทยาศาสตร์ ฉันอยากให้มันมีอะไรพิเศษบางอย่างที่ทำให้ฉันมีช่วงเวลาที่ดีทำให้ฉันได้เรียนรู้อะไรบางอย่างทำให้ฉันสะท้อนความเป็นจริงหรือแค่ให้ความบันเทิงกับฉัน
ดังนั้นฉันจึงสร้างการจัดอันดับใหม่ที่ละเอียดอ่อนโดยใช้คะแนน IMDb และลบคะแนนที่คาดการณ์ไว้ของโมเดลที่ดีที่สุด การทำเช่นนี้ฉันกำลังลบเอฟเฟกต์ของ Genre
, Runtime
และ Year
และการเก็บรักษาข้อมูลอื่น ๆ ที่ไม่รู้จักซึ่งสำคัญกว่าสำหรับฉันมาก
ตอนนี้เรามาดูกันดีกว่าว่า 10 ภาพยนตร์ที่ดีที่สุดจากการจัดอันดับใหม่ของฉันเทียบกับคะแนน IMDb จริง:
ไอเอ็ม
หัวข้อ | ประเภท | คะแนน IMDb | คะแนนกลั่น |
---|---|---|---|
ใครร้องเพลงที่นั่น | ผจญภัย, ตลก, ดราม่า | 8.9 | 1.90 |
ดิปูหมายเลข 2 | การผจญภัยครอบครัว | 8.9 | 3.14 |
เดอะลอร์ดออฟเดอะริง: การกลับมาของราชา | ผจญภัยดราม่าแฟนตาซี | 8.9 | 2.67 |
เดอะลอร์ดออฟเดอะริงส์: มิตรภาพแห่งแหวน | ผจญภัยดราม่าแฟนตาซี | 8.8 | 2.55 |
Anbe Sivam | ผจญภัย, ตลก, ดราม่า | 8.8 | 2.38 |
คลาส Hababam ในวันหยุด | ผจญภัย, ตลก, ดราม่า | 8.7 | 1.66 |
ลอร์ดออฟเดอะริง: หอคอยสองแห่ง | ผจญภัยดราม่าแฟนตาซี | 8.7 | 2.46 |
Mudras โทร | การผจญภัยดราม่าโรแมนติก | 8.7 | 2.34 |
Interstellar | Adventure, Drama, Sci-Fi | 8.6 | 2.83 |
กลับไปสู่อนาคต | Adventure, Comedy, Sci-Fi | 8.5 | 2.32 |
ของฉัน
หัวข้อ | ประเภท | คะแนน IMDb | คะแนนกลั่น |
---|---|---|---|
ดิปูหมายเลข 2 | การผจญภัยครอบครัว | 8.9 | 3.14 |
Interstellar | Adventure, Drama, Sci-Fi | 8.6 | 2.83 |
เดอะลอร์ดออฟเดอะริง: การกลับมาของราชา | ผจญภัยดราม่าแฟนตาซี | 8.9 | 2.67 |
เดอะลอร์ดออฟเดอะริงส์: มิตรภาพแห่งแหวน | ผจญภัยดราม่าแฟนตาซี | 8.8 | 2.55 |
Kolah Ghermezi ไปชั่งน้ำหนัก Khale | ผจญภัย, ตลก, ครอบครัว | 8.1 | 2.49 |
ลอร์ดออฟเดอะริง: หอคอยสองแห่ง | ผจญภัยดราม่าแฟนตาซี | 8.7 | 2.46 |
Anbe Sivam | ผจญภัย, ตลก, ดราม่า | 8.8 | 2.38 |
อัศวินโต๊ะเหลี่ยม | ผจญภัยตลกแฟนตาซี | 8.2 | 2.35 |
Mudras โทร | การผจญภัยดราม่าโรแมนติก | 8.7 | 2.34 |
กลับไปสู่อนาคต | Adventure, Comedy, Sci-Fi | 8.5 | 2.32 |
อย่างที่คุณเห็นแท่นไม่ได้เปลี่ยนแปลงอย่างรุนแรง คาดว่าเป็นเพราะ RMSE ไม่สูงนักและที่นี่เรากำลังดูด้านบน มาดูกันว่าเกิดอะไรขึ้นกับ 10 อันดับสุดท้าย:
ไอเอ็ม
หัวข้อ | ประเภท | คะแนน IMDb | คะแนนกลั่น |
---|---|---|---|
มันเกิดขึ้นในวันพรุ่งนี้ - แท็บลอยด์ขนาดใหญ่ | ตลกลึกลับ | หนึ่ง | -4.86 |
Cumali Ceber: ขออัลเลาะห์พาคุณไป | ตลก | หนึ่ง | -4.57 |
บาดัง | ตลกแฟนตาซี | หนึ่ง | -4.74 |
ยัยกรีก !!! การเสนอชื่อจักรวาล | ตลก | 1.1 | -4.52 |
ภูมิใจอเมริกัน | ละคร | 1.1 | -5.49 |
Browncoats: สงครามอิสรภาพ | แอ็คชั่นไซไฟสงคราม | 1.1 | -3.71 |
วันหยุดสุดสัปดาห์มันมีชีวิตอยู่ | ตลกสยองขวัญลึกลับ | 1.2 | -4.53 |
Bolívar: ฮีโร่ | แอนิเมชันชีวประวัติ | 1.2 | -5.34 |
การเพิ่มขึ้นของค้างคาวดำ | แอ็คชั่นไซไฟ | 1.2 | -3.65 |
Hatsukoi | ละคร | 1.2 | -5.38 |
ของฉัน
หัวข้อ | ประเภท | คะแนน IMDb | คะแนนกลั่น |
---|---|---|---|
ภูมิใจอเมริกัน | ละคร | 1.1 | -5.49 |
ซานต้าและกระต่ายไอศครีม | ครอบครัวแฟนตาซี | 1.3 | -5.42 |
Hatsukoi | ละคร | 1.2 | -5.38 |
การเดินทาง | ชีวประวัติละคร | 1.5 | -5.35 |
Bolívar: ฮีโร่ | แอนิเมชันชีวประวัติ | 1.2 | -5.34 |
Hanum & Rangga: ศรัทธาและเมือง | ดราม่าโรแมนติก | 1.2 | -5.28 |
หลังจากฤดูกาลที่แล้ว | แอนิเมชัน, ดราม่า, ไซไฟ | 1.7 | -5.27 |
Barschel Murder ในเจนีวา | ละคร | 1.6 | -5.23 |
Rasshu raifu | ละคร | 1.5 | -5.08 |
Kamifûsen | ละคร | 1.5 | -5.08 |
สิ่งเดียวกันนี้เกิดขึ้นที่นี่ แต่ตอนนี้เราจะเห็นว่ามีละครปรากฏในกรณีที่มีการกลั่นกรองมากกว่าใน IMDb ซึ่งแสดงให้เห็นว่าละครบางเรื่องอาจได้รับการจัดอันดับสูงเกินไปสำหรับการเป็นละครเท่านั้น
Design Thinking สำหรับกลยุทธ์ทางธุรกิจ
บางทีแท่นที่น่าสนใจที่สุดในการดูคือภาพยนตร์ 10 เรื่องที่มีความแตกต่างมากที่สุดระหว่างคะแนนของระบบการให้คะแนน IMDb กับเรื่องที่ฉันได้รับการปรับแต่ง ภาพยนตร์เหล่านี้เป็นภาพยนตร์ที่ให้น้ำหนักกับลักษณะที่ไม่รู้จักและทำให้ภาพยนตร์ดีขึ้น (หรือแย่ลง) มากกว่าที่คาดไว้สำหรับคุณสมบัติที่เป็นที่รู้จัก
หัวข้อ | คะแนน IMDb | คะแนนกลั่น | ความแตกต่าง |
---|---|---|---|
Kanashimi no beradonna | 7.4 | -0.71 | 8.11 |
พระเยซูคริสต์ซูเปอร์สตาร์ | 7.4 | -0.69 | 8.09 |
พิงค์ฟลอยด์เดอะวอลล์ | 8.1 | 0.03 | 8.06 |
Tenshi no tamago | 7.6 | -0.42 | 8.02 |
จิบอนเทคเนย่า | 9.4 | 1.52 | 7.87 |
เต้น | 7.8 | 0.00 | 7.80 |
ซานต้าและหมีสามตัว | 7.1 | -0.70 | 7.80 |
เรื่องราวความสุขของ Scrooge | 7.5 | -0.24 | 7.74 |
ผิวตูด | 7 | -0.74 | 7.74 |
พ.ศ. 2319 | 7.6 | -0.11 | 7.71 |
ถ้าฉันเป็นผู้กำกับภาพยนตร์และต้องผลิตภาพยนตร์เรื่องใหม่หลังจากทำการวิเคราะห์ข้อมูล IMDb ทั้งหมดนี้ฉันก็มีความคิดที่ดีขึ้นว่าจะสร้างภาพยนตร์ประเภทใดเพื่อให้มีอันดับ IMDb ที่ดีขึ้น มันจะเป็นละครชีวประวัติแอนิเมชั่นเรื่องยาวที่จะนำมารีเมคจากภาพยนตร์เก่าตัวอย่างเช่น Amadeus นี่อาจจะทำให้มั่นใจได้ว่ามีอันดับ IMDb ที่ดี แต่ฉันไม่แน่ใจเกี่ยวกับผลกำไร ...
คุณคิดอย่างไรเกี่ยวกับภาพยนตร์ที่อยู่ในอันดับใหม่นี้? คุณชอบพวกเขาไหม? หรือคุณชอบแบบดั้งเดิมมากกว่ากัน? แจ้งให้เราทราบในความคิดเห็นด้านล่าง!
IMDb (ฐานข้อมูลภาพยนตร์ทางอินเทอร์เน็ต) เป็นฐานข้อมูลออนไลน์ของข้อมูลที่เกี่ยวข้องกับเนื้อหาภาพและเสียง
ระบบการให้คะแนน IMDb เป็นวิธีการสั่งซื้อเนื้อหาภาพและเสียงโดยคะแนนที่สร้างขึ้นจากการโหวตของผู้ใช้เว็บ
ข้อมูลหลักของ IMDb เกี่ยวกับภาพยนตร์: พวกเขาเก็บชื่อปีขั้นต้นระยะเวลาประเภทและลักษณะทั่วไปอื่น ๆ
จุดประสงค์ของ IMDb คือเป็นสารานุกรมเนื้อหาภาพและเสียงที่ใหญ่ที่สุดและใหญ่ที่สุด