ตัวเลือกภาษา

ข้อมูลเชิงลึก > ผู้ชม

สิ่งที่ต้องรู้: ข้อดีและข้อเสียของข้อมูลขนาดใหญ่ในการวัดผู้ชม

8 minute read | August 2023

Big Data ยังคงเป็นข่าวพาดหัวอยู่เรื่อยๆ แต่ Big Data คืออะไรกันแน่ และทำไมมันจึงเป็นทั้งของขวัญและอุปสรรคที่อาจขัดขวางการวัดผลกลุ่มเป้าหมายได้อย่างแม่นยำ เราจะเจาะลึกข้อดีและข้อเสียของ Big Data และวิธีที่จะทำให้มันใช้งานได้ผล  

บิ๊กดาต้าคืออะไร?

ในโลกของสื่อเชิงเส้น ข้อมูลขนาดใหญ่โดยทั่วไปจะหมายถึงข้อมูลสตรีมสองประเภทที่ผลิตโดยระบบที่ส่งโปรแกรมไปยังผู้ใช้ปลายทาง: ข้อมูลเส้นทางกลับ (RPD) จากกล่องรับสัญญาณเคเบิลหรือดาวเทียม (เช่น Dish หรือ DirecTV) และการจดจำเนื้อหาอัตโนมัติ (ACR) จากทีวีอัจฉริยะที่เชื่อมต่ออินเทอร์เน็ต (เช่น Samsung หรือ Vizio)

ข้อมูล ACR

เทคโนโลยี ACR จะตรวจสอบภาพบนหน้าจอทีวีแทนการบันทึกการเปลี่ยนช่อง ภาพจะทำหน้าที่เหมือนลายนิ้วมือ ซึ่งจะถูกนำไปเปรียบเทียบกับห้องสมุดอ้างอิงขนาดใหญ่เพื่อระบุว่ารายการหรือโฆษณาคืออะไร ภาพจะถูกประทับเวลาเพื่อให้เข้าใจว่ากำลังเล่นอยู่เมื่อใด

ข้อมูล RPD

บันทึกว่ากล่องรับสัญญาณทีวีรับสัญญาณช่องใดและมีการเปลี่ยนแปลงช่องเมื่อใด ข้อมูลดังกล่าวสามารถนำไปจับคู่กับตารางรายการทีวีเพื่อระบุว่ารายการใดกำลังเล่นอยู่ ณ เวลานั้น และสามารถใช้ข้อมูลจากเซิร์ฟเวอร์โฆษณาของผู้ให้บริการหรือพันธมิตรเพื่อระบุว่าครัวเรือนนั้นรับชมโฆษณารายการใด

ในทั้งสองกรณี ผู้ใช้ปลายทางอนุญาตให้รวบรวมข้อมูลบนอุปกรณ์ของตน ความร่วมมือค่อนข้างสูงเนื่องจากการรวบรวมข้อมูลไม่เพียงแต่ช่วยวัดผลเท่านั้น แต่ยังช่วยส่งเสริมคุณลักษณะที่ต้องการ เช่น การตั้งค่าของผู้ใช้และคำแนะนำเนื้อหา ชุดข้อมูล RPD หรือ ACR อาจครอบคลุมอุปกรณ์ได้มากกว่า 30 ล้านเครื่อง

เหตุใด Big Data จึงเป็นเรื่องใหญ่?

There was a time when people had only a handful of channels to choose from. A household rating1 over 60 (like the finale of M*A*S*H in 1983) or even 40 (like the Seinfeld finale in 1998) is unfathomable for a scripted show today. We live in a much more fragmented world, with a very long, long list of programming options.

ซึ่งถือเป็นเรื่องดีสำหรับผู้ชมทีวี แต่การวิจัยแบบกลุ่มตัวอย่างนั้นมีความซับซ้อนมากขึ้น ในกลุ่มตัวอย่างทั่วประเทศที่มีผู้ชม 101,000 คน รายการทีวีที่มีเรตติ้ง 0.2 จะถูกรับชมโดย 80 ครัวเรือน และอาจมีเพียงครัวเรือนเดียวในเขตมหานครแอตแลนตาหรือดัลลาส ด้วยอุปกรณ์นับสิบล้านเครื่องที่อยู่ภายใต้การวัด บิ๊กดาต้าทำให้บริษัทวิจัยสามารถรายงานการใช้งานทีวีได้ในระดับที่ละเอียดกว่ามาก ทำให้ครอบคลุมรายการต่างๆ ได้มากขึ้นสำหรับผู้ชมจำนวนน้อยและหลากหลาย แต่บิ๊กดาต้าเพียงอย่างเดียวไม่ได้มีไว้เพื่อใช้ในการวัดผู้ชม เราจะเจาะลึกข้อดีและข้อเสียของบิ๊กดาต้าในการวัดผู้ชม

ข้อจำกัดของข้อมูลขนาดใหญ่

ความท้าทาย #1: ข้อมูลขนาดใหญ่ไม่ได้เป็นตัวแทน

เพื่อทำธุรกรรมด้วยความมั่นใจ ผู้ซื้อและผู้ขายสื่อต้องมีโซลูชันการวัดผลที่สะท้อนประชากรในความหลากหลายทั้งหมด กลุ่มอายุ เชื้อชาติ กลุ่มชาติพันธุ์ และลักษณะทางประชากรและพฤติกรรมที่สำคัญอื่นๆ มากมาย ต้องมีอยู่ในข้อมูลพื้นฐานและเป็นสัดส่วนกัน

But size doesn’t guarantee representativeness. When analyzing installed counts in the Nielsen National TV panel, we’ve found that homes with RPD are disproportionately older and less racially diverse than the general population. Hispanic households, for instance, are underrepresented by about 30%, and heads of household under the age of 25 are almost entirely absent from RPD datasets. On the other hand, ACR datasets skew younger than the general population, and have more household members, too. Using statistical weighting in big data may hide the issue, but it can’t make up for the missing, unique viewing behaviors of underrepresented audiences.

To make matters worse, a measurement solution relying exclusively on RPD and ACR data would miss over-the-air2 and streaming-only households, which are a growing piece of the pie.

ความท้าทาย #2: ข้อมูลขนาดใหญ่ไม่สามารถบันทึกพฤติกรรมการรับชมทั้งหมดได้

แม้ว่าจะมีครัวเรือนที่เป็นตัวแทน แต่ชุดข้อมูล RPD และ ACR ก็ไม่ได้บันทึกการรับชมจากกล่องรับสัญญาณทุกกล่องในบ้านหรือจากทีวีเครื่องอื่นๆ ในบ้านที่ไม่ใช่สมาร์ททีวี ทีวีเพิ่มเติมเหล่านี้อาจเล่นรายการต่างๆ ให้กับสมาชิกในครอบครัวที่แตกต่างกัน (เช่น รายการทำอาหารในครัวหรือรายการเด็กในห้องเล่น) ดังนั้นครัวเรือนที่ใช้บิ๊กดาต้าจึงไม่เพียงแต่ไม่เป็นตัวแทนของประชากรเท่านั้น แต่บิ๊กดาต้าเองก็ไม่ได้เป็นตัวแทนของการรับชมทั้งหมดที่อาจเกิดขึ้นในบ้านเหล่านั้นด้วย

A frustrating issue for research companies relying on RPD is that the set-top box often remains on when the attached TV set is turned off. That ‘phantom’ tuning can exaggerate actual viewing by 145% to 260%, depending on the provider. There are models that can be implemented to compensate for it, but without a point of reference—like a panel informed by real viewing—it can be difficult to develop the right heuristics.

ACR isn’t immune from data quality issues either. Some smart TV streaming applications block ACR from capturing the content on screen while the app is in use. It may look like the TV set is off when in fact the content has been blocked by an app. And most providers monitor only a small portion of all available programming. In a recent analysis, we found that ACR providers currently monitor just 31% of all available stations, and 23% of recorded minutes are still coming from stations that aren’t monitored. With no reference fingerprints to compare to, that viewing goes unreported.

ความท้าทาย #3: ข้อมูลขนาดใหญ่ขาดข้อมูลประชากรผู้ชม

ผู้ให้บริการ RPD และ ACR รวบรวมข้อมูลการปรับแต่งจากอุปกรณ์หลายล้านเครื่อง แต่พวกเขาไม่ทราบว่าใครกำลังรับชม ซึ่งนั่นคือสิ่งที่ผู้โฆษณาต้องการในที่สุด

วิธีหนึ่งในการชดเชยข้อบกพร่องดังกล่าวคือการร่วมมือกับซัพพลายเออร์ข้อมูลประชากรบุคคลที่สาม บริษัทเหล่านี้เก็บรักษาบันทึกองค์ประกอบข้อมูลประชากรของทุกครัวเรือนในประเทศ และบริษัทวิจัยอาจพยายามสร้างแบบจำลองว่าใครกำลังรับชมอะไรจากข้อมูลการปรับจูนทั้งหมดในครัวเรือนหนึ่งๆ และองค์ประกอบข้อมูลประชากรของครัวเรือนนั้นๆ

รายการสำหรับเด็กเหรอ? นั่นต้องเป็นของเด็กในบ้าน การแข่งขันมวยปล้ำเหรอ? นั่นต้องเป็นของผู้ชมที่เป็นผู้ชาย หากไม่มีจุดอ้างอิงในชีวิตจริงเพื่อช่วยอัลกอริทึมการเรียนรู้ของเครื่อง คุณก็จะเห็นได้อย่างง่ายดายว่าการสร้างแบบจำลองประเภทนี้อาจล้มเหลวตรงไหน ไม่น่าแปลกใจที่การสร้างแบบจำลองประเภทนี้จะน่าเชื่อถือน้อยลงเรื่อยๆ ตามขนาดครัวเรือน และนั่นส่งผลให้ความแม่นยำของข้อมูลลดลงสำหรับครอบครัวที่มีขนาดใหญ่ เช่น ครอบครัวที่มีลูก ผู้ชมที่ไม่ใช่คนผิวขาว และผู้ชมที่อายุน้อยกว่า 

ข้อดีของข้อมูลแผง 

For brands and media companies looking for a stable, reliable audience measurement solution, the challenges outlined above are nonstarters. Panel data is critical to overcome those limitations.

At Nielsen, when we analyze RPD or ACR data, we’re able to identify what homes and devices are part of our panels, and compare the tuning data in those homes to the viewing behavior captured by our meters. By using our panels as a source of truth in those homes, we can pinpoint where big data deviates from the truth and develop robust models to adjust for those anomalies.

ตัวอย่างเช่น เราพัฒนาวิธีการในการหาว่าอุปกรณ์อยู่ที่ใดภายในบ้านและจับคู่ข้อมูลการปรับจูนกับผู้ชมเฉพาะราย โมเดลอื่นช่วยให้เราระบุได้ว่าทีวีปิดอยู่หรือไม่ในขณะที่กล่องรับสัญญาณทีวีเปิดอยู่ โมเดลอื่นสามารถจัดเรียงการอัปเดตอุปกรณ์ที่ลงทะเบียนเป็นการปรับจูนเพิ่มเติม รวมถึงสถานการณ์ที่อุปกรณ์ส่งคืนเหตุการณ์การปรับจูนมากกว่าหนึ่งครั้งในเวลาเดียวกัน

ผู้คน ไม่ใช่อุปกรณ์

ท้ายที่สุดแล้ว การวิจัยผู้ชมจะเกี่ยวกับผู้คน ไม่ใช่เกี่ยวกับอุปกรณ์

ไม่ต้องสงสัยเลยว่าข้อมูลขนาดใหญ่นั้นเป็นส่วนเสริมที่ยอดเยี่ยมสำหรับคลังอาวุธของนักวิจัยด้านสื่อ มันเปิดประตูสู่การรายงานที่ละเอียดกว่าที่เคยเป็นไปได้ในอดีต แต่โดยเนื้อแท้แล้ว ข้อมูลขนาดใหญ่มีข้อบกพร่อง มีอคติ และโดยพื้นฐานแล้วคือขาดวิสัยทัศน์ ข้อมูลขนาดใหญ่จะจับข้อมูลที่ปรับแต่ง ไม่ใช่ข้อมูลการดู

เพื่อให้บรรลุศักยภาพ จำเป็นต้องทำความสะอาด เติมข้อมูล ปรับเทียบ และเสริมด้วยข้อมูลประชากรที่เกี่ยวข้อง นั่นคือจุดที่ข้อมูลแผงเข้ามามีบทบาท การเรียนรู้ของเครื่องจักรทำงานได้ดีที่สุดด้วยข้อมูลการฝึกอบรมและการตรวจสอบที่แข็งแกร่ง และไม่มีข้อมูลการฝึกอบรมใดในอุตสาหกรรมที่ดีไปกว่าข้อมูลแผงที่เป็นตัวแทนระดับประเทศซึ่งเป็นหัวใจสำคัญของธุรกิจการวิจัยสื่อในปัจจุบัน

Nielsen’s Need to Know reviews the fundamentals of audience measurement and demystifies the media industry’s hottest topics. Read every article here.

Note

 1 A household rating is the percentage of all households in the country tuned to a given program.
2 Programming available via a “signal” from an antenna. Over the air (OTA) broadcasts were the first type of TV available.

ดำเนินการเรียกดูข้อมูลเชิงลึกที่คล้ายกันต่อไป

ผลิตภัณฑ์ของเราสามารถช่วยคุณและธุรกิจของคุณได้