
ความจริงในการวัดไม่เคยมีความสำคัญมากเท่านี้มาก่อน ดังนั้น ความจริงจึงเป็นวาระเดียวของเรา แต่การบรรลุความจริงนั้นไม่เคยซับซ้อนเท่านี้มาก่อน แม้ว่าหลายคนจะมองว่าข้อมูลขนาดใหญ่เป็นยารักษาโรคสำหรับการวัดในโลกที่เต็มไปด้วยดิจิทัล แต่เราก็รู้ว่ามันไม่ง่ายอย่างนั้น
Nielsen’s panels have been the foundation of persons-level measurement for decades, and they remain so today. The growth of big data, however, can’t be ignored as a source of valuable information. But big data alone isn’t suitable for representative measurement. Think about when you change the channel on your TV. That change becomes part of big data, but there is no record of who made the change or who witnessed it.
To highlight the shortcomings of big data from a measurement perspective, we conducted an analysis in the U.S. earlier this year that compared set-top box data with set-top box data that we calibrated with Nielsen panel data. The analysis found that the uncalibrated data is inherently biased and underrepresents minority audiences.
อย่างไรก็ตาม นั่นไม่ได้หมายความว่าข้อมูลขนาดใหญ่ไม่มีค่า ตรงกันข้ามเลย แต่ข้อมูลจะต้องได้รับการวางรากฐานบนชุดความจริงพื้นฐาน นั่นคือจุดที่แผงข้อมูลและปัญญาประดิษฐ์ (AI) ของเราเข้ามามีบทบาท ข้อมูลแผงข้อมูลของเราซึ่งเป็นกุญแจสำคัญในการวัดระดับบุคคล เป็นชุดความจริงที่สมบูรณ์แบบสำหรับการฝึกอบรมข้อมูลขนาดใหญ่
เราใช้ข้อมูลขนาดใหญ่เพื่อขยายขีดความสามารถในการวัดผลของเราอย่างมากโดยยังคงรักษาคุณภาพและความเป็นตัวแทนไว้ได้ ปัจจุบัน AI เป็นส่วนสำคัญในวิธีการวัดผลของเรา ตัวอย่างเช่น AI มีบทบาทสำคัญในการพัฒนาขีดความสามารถในการวัดผลที่เพิ่มขึ้นสำหรับตลาดทีวีในท้องถิ่น ซึ่งผสมผสานขนาดของข้อมูลขนาดใหญ่ (ข้อมูลเส้นทางกลับ {RPD} จากเครื่องรับโทรทัศน์) เข้ากับข้อมูลแผงในตลาดที่เป็นตัวแทนอย่างสมบูรณ์
ในขณะที่เราพยายามรวม RPD เข้ากับการวัดในระดับท้องถิ่น เราได้ระบุการใช้งาน AI ที่สำคัญสี่ประการ
การจดจำรูปแบบข้อมูล
ขณะที่เราค้นคว้าวิธีผสาน RPD เข้ากับการวัดของเรา เราได้ระบุข้อจำกัดที่เกี่ยวข้องกับ RPD ผ่านสิ่งที่เราเรียกว่า "การวิเคราะห์บ้านทั่วไป" สำหรับการวิเคราะห์เหล่านี้ ซึ่งยังคงดำเนินการอยู่ในปัจจุบัน เราเปรียบเทียบข้อมูลการปรับจูนจากมิเตอร์ Nielsen กับข้อมูลการปรับจูน RPD การวิเคราะห์เหล่านี้ครอบคลุมบ้านมากกว่า 5,000 หลัง (ทีวี 12,000 เครื่อง) ในแต่ละเดือน และพบว่า RPD ขาดการปรับจูนบางส่วน
เพื่อแก้ไขข้อบกพร่องนี้ เราได้พัฒนาเทคนิคที่อยู่ระหว่างการจดสิทธิบัตรซึ่งใช้ตัวจำแนกประเภทเพื่อจดจำรูปแบบที่เกี่ยวข้องกับการปรับแต่งที่ขาดหายไปในบ้าน RPD จากนั้นอัลกอริทึม AI จะลบบ้านเหล่านี้ออกจากการใช้งานในการวัด
การทราบเวลาที่กล่องรับสัญญาณทีวีเปิดอยู่และเวลาที่ทีวีปิดอยู่
การวิเคราะห์บ้านทั่วไปของ Nielsen วิเคราะห์เวลาการปรับจูนมากกว่า 77 ล้านนาทีในแต่ละเดือน ซึ่งให้ข้อมูลเชิงลึกอันทรงพลัง อย่างไรก็ตาม การปรับจูนดังกล่าวไม่แม่นยำเสมอไป ตัวอย่างเช่น ผู้คนไม่ได้ปิดกล่องรับสัญญาณโทรทัศน์เสมอไปเมื่อปิดทีวี RPD นำเสนอสถานการณ์เหล่านี้ว่าเป็นการดูทีวีแม้ว่าจะไม่มีใครดูอยู่ก็ตาม
เราสามารถเอาชนะข้อจำกัดนี้ได้โดยการใช้ตัวจำแนกการเรียนรู้เชิงลึกเพื่อระบุสถานการณ์ที่เซ็ตท็อปบ็อกซ์เปิดอยู่ในขณะที่ทีวีปิดอยู่ จากนั้นอัลกอริทึมจะลบการปรับจูนที่ไม่ถูกต้องออกจาก RPD
การระบุลักษณะครัวเรือนและข้อมูลประชากรจาก RPD
RPD ไม่มีชื่อและไม่มีหน้าตา และไม่สามารถให้ข้อมูลประชากรได้ ข้อมูลประชากรมีความสำคัญอย่างยิ่งในการแสดงข้อมูลทุกกลุ่มของประชากรได้อย่างถูกต้อง และยิ่งไปกว่านั้น การวัดผลที่แม่นยำยังหมายถึงความสามารถในการวัดจำนวนคน ไม่ใช่แค่ครัวเรือนเท่านั้น
เพื่อปลดล็อกข้อมูลที่มีประสิทธิภาพภายในบ้าน RPD เราจึงปรับเทียบ RPD ด้วยลักษณะที่ทราบ ข้อมูลประชากร และข้อมูลการปรับแต่งจากบ้านที่วัดโดย Nielsen มากกว่า 45,000 หลัง และลักษณะและข้อมูลประชากรที่กำหนดโดยบุคคลที่สาม จากนั้นเราจึงเพิ่มอินพุตเหล่านี้ลงในเครือข่ายประสาทเทียมแบบวนซ้ำที่รอการจดสิทธิบัตรและเทคนิคการเขียนโปรแกรมจำนวนเต็มแบบผสมที่ระบุลักษณะและข้อมูลประชากรของบ้าน RPD ได้อย่างแม่นยำ อัลกอริทึม AI นี้ช่วยให้เราสามารถรายงานลักษณะประชากรของบุคคลและครัวเรือนได้อย่างแม่นยำ
การกำหนดตำแหน่งห้องสำหรับเซ็ตท็อปบ็อกซ์
ข้อมูลของ Nielsen Panel ให้ข้อมูลผู้ชมและสถานที่รับชม แต่ RPD ไม่ได้ให้ข้อมูลดังกล่าว อย่างไรก็ตาม เราสามารถรับข้อมูลดังกล่าวจาก RPD ได้โดยใช้ AI เราใช้ระเบียบวิธีที่ได้รับการพิสูจน์แล้วทางวิทยาศาสตร์เพื่อระบุว่าสมาชิกในครัวเรือนคนใดกำลังรับชมและกำลังรับชมอยู่ที่ใดภายในบ้าน
การวิจัยพบว่าตำแหน่งของห้องเป็นปัจจัยสำคัญอย่างหนึ่งในการทำนายว่าสมาชิกในครัวเรือนคนใดจะเป็นผู้ชมรายการ ดังนั้นเราจึงใช้ตัวจำแนกประเภทเพื่อระบุตำแหน่งของห้องของกล่องรับสัญญาณโทรทัศน์ที่ทำการจูนสัญญาณในบ้านที่มีระบบ RPD ด้วยวิธีนี้ เราจึงสามารถใช้ตัวแปรนี้ในการกำหนดผู้ชมได้
ด้วยข้อมูลที่มีอยู่มากมายในปัจจุบัน จึงเกิดความน่าดึงดูดใจที่จะมองข้อมูลขนาดใหญ่ผ่านแว่นตาสีชมพู อย่างไรก็ตาม หากไม่มีการเชื่อมต่อกับบุคคล ข้อมูลขนาดใหญ่ก็จะไม่แม่นยำเลย เราพบว่า AI เป็นวิธีที่มีประสิทธิภาพในการแก้ไขอคติในข้อมูลขนาดใหญ่ และเรายินดีที่จะนำเสนอนวัตกรรมนี้ให้กับลูกค้า นวัตกรรมนี้ได้รับประโยชน์จากทั้งข้อมูลจำนวนมากที่แหล่งข้อมูลขนาดใหญ่ให้มาและชุดข้อมูลจริงที่ช่วยให้ลูกค้าสามารถวางแผน เปิดใช้งาน และวัดผลตามข้อมูลที่มีความเป็นตัวแทนและถูกต้อง
This article first appeared on Medium.



