02_Elements/Icons/ArrowLeft 返回洞察力

洞察力 > 媒体

返回发件人:仅凭大数据如何产生偏见和缺乏代表性

6 minute read | March 2019

在设备和受众碎片化的今天,每个观众显然都是重要的潜在消费者,即使他们的个性化内容消费以及内容本身的颗粒度更细。

Being able to measure in a way that fairly represents all races, ages, ethnicities and behaviors is crucial for the industry to transact with confidence. It’s also the only way to make sure that content choices reflect the diversity of a given station’s community.

无论是节目制作者希望了解真实受众的多样性构成以做出节目编排决策,还是广告商希望通过精准的信息触及特定人群,抑或是媒体所有者通过在选角时考虑到多样性而在屏幕包容性方面做出更多努力,业内所有运营商都有了解真实受众构成的业务需求。这就是为什么他们所依赖的任何测量见解都必须能够充分代表美国人口的丰富多样性。任何一个或多个群体都不应被有意或无意地排除在外或代表性不足。

简而言之,"小众 "观众或网络已不复存在,任何受众都不应该因为测量过程没有考虑到他们,或者更糟的是,甚至没有考虑到他们而被遗忘。在测量方面,包容性是当务之急,而不是一种选择。

虽然大数据有很多好处,但如果公司不负责任地对待它,也会带来负面影响。利用大数据的优势(如在高度分散的收视环境中提供稳定的测量)和真正的人际测量是至关重要的。简而言之,大数据作为一种独立的资源,并不适合全面了解受众动态。

A recent Nielsen analysis looked at how big data, built without representation in mind, could obscure what those true audiences are because of inherent bias, as the data included, such as people WITHOUT set top boxes, people who leverage over-the-air (OTA) signals and stream over-the-top (OTT) content to watch premium television programming.

具体而言,该分析试图了解返回路径数据(RPD)--拥有能够返回数据的机顶盒的家庭--与使用根据尼尔森观众面板校准的观众数据的家庭之间的观众测量差异。分析发现,未经校准的 RPD 数据使用了可疑的加权方法,对少数群体观众的计算不足,而且存在固有偏见。将其与 "人口普查 "数据相提并论是一种方法论上的轻信。

毕竟,美国人对视频节目的需求已不再千篇一律。一些人没有足够的收入来购买高级娱乐内容;另一些人则在数字技术不断进步的情况下选择观看 OTA 节目。广泛的技术进步也推动了纯宽带(BBO)家庭的稳步增长。在美国,OTA 和 BBO 家庭的数量从 2014 年的 1500 万个增加到 2018 年的近 2800 万个。如果考虑到这 2,800 万个家庭中有 41% 的消费者是多元文化(西班牙裔、非裔美国人或亚裔),10% 的消费者是年轻人群(18-24 岁),那么很明显,RPD 样本对这些受众的代表性会明显不足,从而使受众总数的测量出现偏差。

RPD-capable data alone consistently under-represents Hispanic and African American homes compared to other household types. Compared with official U.S. Census estimates and Nielsen’s representative national panel, RPD-capable homes under-represent Hispanics by 33%, Spanish-language dominant Hispanics by 49% and African Americans by 34%. When you compare RPD-capable with OTA/BBO homes, the representation disparity is even bigger. RPD-capable measurement under-represents Hispanics by 50%, Spanish-language dominant Hispanics by 68% and African Americans by 38%. Weighting alone does not cure this problem, and the fact that millions of RPD homes are counted doesn’t matter. A large biased sample is still biased.

而且,这些信息来源偏向的不仅仅是多元文化受众。

从年龄角度看,具备 RPD 功能的数据对年轻群体的代表性不足,而对年长群体的代表性过高。例如,25-34 岁的消费者被低估了 26%,而 50 岁以上的消费者实际上被高估了 15%。那么 18-34 岁这一更大的关键人群呢?尼尔森的全国面板和人口普查数据还显示,截至 2018 年 12 月,电视家庭中有 6980 万 18-34 岁的成年人。这一人群正在引领剪线革命,占剪线人群的最大份额。但是,与具有代表性的面板相比,具备 RPD 功能的家庭对 18-34 岁成年人进行准确分型的可能性要低 17%。

由于对 18-34 岁成年人的计算不足,营销人员、媒体所有者以及介于两者之间的所有人如果仅依靠 RPD 数据,可接触到的受众人数就会减少。对这一问题进行加权可能会掩盖 RPD 数据的固有问题,但并不能解决问题或揭示这些受众的独特收视行为。RPD 家庭并不代表非 RPD 家庭的收视情况。每隔几年偶尔进行的在线调查应用于复杂的日常收视记录,是一种廉价而粗心的方法,看起来好像已经纠正了什么问题。

对属于 RPD 群体的消费者、不具备 RPD 功能的群体(这意味着这些消费者可能拥有一个不返回数据的机顶盒)以及不断增长的 OTA/BBO 群体进行调查,可以发现他们的行为和生活方式存在明显差异。无论如何加权,也无论大数据输入的规模是 3 千万、十亿还是万亿,这都只能通过直接观察来获得。

那么,这对由多元文化受众推动的实际节目制作意味着什么呢?这意味着需要考虑所有来源,观察所有类型的受众,以便将其纳入大数据集并进行校准。

For example, a show like Fox’s Empire, where the audience composition is predominantly multicultural, the analysis found that these audiences were anything but “niche,” considering the show’s history as a program near the top of the ranks. In fact, diverse audiences made up 75% of Empire in December 2018 and these audiences certainly helped drive ratings success when using a representative panel.

But because of its inherent bias of under-representation, these multicultural audiences were not fairly reflected resulting in significant undercounts of Empire’s audience when looking at this show through an RPD lens. The differences are quite large. Looking at a rank among 25-54 year old viewers, Empire ranked 16th using Nielsen’s representative panel, but dropped to 38 in RPD homes. Conversely, Empire ranked third among OTA homes, which, while not surprising because these homes are more diverse, demonstrates the critical nature of actually including these homes and accurately measuring their behavior in any sample.

归根结底,依赖任何不全面、不准确、不包容的测量方法,都会损害包容性的基本要素和核心原则。根据定义将这些 "小众 "观众及其行为排除在外会产生深远的影响,可能会给市场和营销人员带来不稳定的错误信息,甚至会阻碍屏幕包容性的发展。

继续浏览类似的见解

我们的产品可以帮助您和您的企业