02_Elements/Icons/ArrowLeft Zurück zu Einblicke

Einblicke > TV & streaming

Das nicht so versteckte Problem mit großen Datensätzen

6 Minuten lesen | Molly Poppie, SVP Data Science, Nielsen | Oktober 2021

There’s been a lot of energy and excitement in media circles of late about the future of measurement and the promise of big data. At Nielsen, we’ve long understood the value of big data, in fact just last month we announced additional details around how we are adding it to our national TV measurement service

Wir wissen auch, dass kein panel perfekt ist, wie die letzten Monate gezeigt haben. 

Aber wenn unsere Teams von Datenwissenschaftlern einige der großen, breit gefächerten Behauptungen über Big Data hören, die den Tag retten und alle vermeintlichen Herausforderungen in der Branche lösen sollen, ist es schwer, nicht skeptisch zu sein.

That’s because, for all it’s value and amazing potential, the big data sets that the industry currently has access to have very real limitations

Ein aktuelles Beispiel

Nachdem Comscore den Zugang zu den Portable People Meters von Nielsen verloren hat, berichtet das Unternehmen, dass es nun Datensätze von Experian's ConsumerView verwenden wird, um einzelne Zuschauer für Messzwecke zu identifizieren. Die Ankündigung wurde in der Fachpresse als Fortschritt dargestellt - denn wenn Big Data die Zukunft ist, muss jede Veränderung in diese Richtung eine gute Sache sein. 

Zum Leidwesen ihrer Kunden und der Verbraucher ist dies jedoch nicht der Fall. 

Es gibt eine Handvoll Drittanbieter von Identitätsdaten, die in der Lage sind, Datensätze auf der Grundlage personenbezogener Daten abzugleichen und demografische Merkmale bereitzustellen, die sowohl direkt erhoben als auch modelliert wurden. 

Bei Nielsen überprüfen wir diese Daten regelmäßig. Wir tun dies, indem wir Informationen aus unseren robusten panels direkt messen, um zu validieren, wie genau diese Datensätze 1) einem Haushalt korrekt zugeordnet sind und 2) demografische Daten und Merkmale korrekt wiedergeben. 

Was wir in der Regel finden, sollte Werbetreibenden zu denken geben. 

Die meisten der heute verfügbaren Datensätze basieren auf Rechnungsdaten oder der Erfassung des Online-Verhaltens, nicht auf demografischen Profilen. Sie verfügen nicht über die umfangreichen Details darüber, wer genau die Personen auf ihren Listen sind - vom Alter über das Einkommen bis hin zu Ethnie und Volkszugehörigkeit - wie dies bei einem robusten panel Fall ist. Da diese Datensätze durch Übertragungen von Maschine zu Maschine erstellt werden, erhöhen sie auch die Möglichkeit von Verschwendung und Betrug. 

Aus diesem Grund können sie nur bedingt Auskunft darüber geben, wer tatsächlich in einem bestimmten Haushalt lebt. Und sie können nicht sagen, wer in einem bestimmten Haushalt ein bestimmtes Programm zu einer bestimmten Zeit sieht. 

Selbst wenn Sie diese Daten mit anderen Quellen abgleichen, sind massive Lücken und Fehler in Ihren Schätzungen fast garantiert. Das mag akzeptabel sein, wenn der Anwendungsfall die Zielgruppenansprache ist, aber diese Daten allein bieten nicht die Genauigkeit, Objektivität und Transparenz, die für eine Messung erforderlich sind. 

Warum das wichtig ist

Was bedeutet das nun praktisch? Nun, es hat ein paar Auswirkungen. 

Im Falle von Comscores Abkehr von unseren Personal People Meters, die tatsächlich Mikrofone an ~100.000 realen, verifizierten Menschen anbringen und genau verfolgen, was sie sich ansehen, 

zu einem Modell, das anhand von Abrechnungsdaten Schätzungen darüber anstellt, wer in einer Wohnung ein bestimmtes Programm zu einem bestimmten Zeitpunkt sieht, wird das Ergebnis eine weniger genaue Anzeige darüber sein, wer was sieht. 

Die möglicherweise größere Auswirkung ist jedoch, dass diese Verschiebung die Branche noch weiter davon entfernt, ein wahres Bild des Landes zu zeichnen. 

Wir wissen, dass viele dieser Arten von Datensätzen besser geeignet sind, Daten über Haushalte zu liefern, wenn die dort lebenden Menschen ihr eigenes Haus besitzen und schon lange dort leben. Und das ist nur logisch. Das Problem dabei ist, dass Menschen, die seit langem ein Eigenheim besitzen, in der Regel weißer, wohlhabender und deutlich älter sind als die Bevölkerung insgesamt. In diesen Datensätzen werden Schwarze und Braune, Menschen mit geringerem Einkommen und jüngere Menschen unterrepräsentiert, und das zu einer Zeit, in der alle diese Gruppen wachsen und nicht schrumpfen. 

Das Gleiche gilt für Datensätze, die auf der Grundlage von Set-Top-Box-Daten erstellt werden, die dazu neigen, wohlhabendere Verbraucher, die bereit sind, mehr für Kabelpakete zu zahlen, zu überbewerten, und somit einkommensschwächere Verbraucher, die für viele Vermarkter wichtige Zielgruppen darstellen, unverhältnismäßig stark ausschließen. 

Die Medienbranche hat zu Recht die genaue Darstellung der schwarzen und braunen Gemeinschaften zu einer zentralen Priorität gemacht. Bei Nielsen war unsere jahrzehntelange Erfolgsbilanz in dieser Hinsicht nicht perfekt, aber heute haben wir den genauesten und fortschrittlichsten Blick auf die Nation, wie sie wirklich ist. 

Von Big Data abgeleitete Messinstrumente, die nicht durch ein repräsentatives, validiertes und geprüftes panel gestützt werden, können diesen Anspruch nicht erheben. panels können viele demografische Gruppen innerhalb der Volkszählung mit einer Variabilität von 1 % erfassen, aber die auf Big Data basierenden Optionen kommen nicht einmal annähernd daran heran. Die Branche muss offen und ehrlich mit sich selbst sein, wenn es um die Herausforderungen geht, die Big Data in Bezug auf die Repräsentation mit sich bringt.

Ein größeres Problem

Um es klar zu sagen: Das ist nicht nur ein Problem von Comscore. Dies ist ein Problem mit allen großen Datensätzen, die es derzeit gibt. 

In August of 2020 the ANA, in partnership with the MRC and Sequent Partners, used Nielsen data as a benchmark in a study designed to understand the degree to which the multicultural audiences were being accurately represented in media targeting. The study looked at an aggregated collection of high-quality marketing and media data and sought to understand how accurately it was targeting Black, Brown and Asian audiences. The findings were troubling, but not at all surprising to us. 

Die Studie ergab, dass die großen Datensätze, auf die sich die Branche verlässt, der Aufgabe nicht gewachsen sind, diese kritischen Gemeinschaften genau anzusprechen. Zum Teil deshalb, weil die Datensätze nicht darauf ausgelegt waren, umfassende Daten darüber zu erfassen, wer diese Verbraucher wirklich sind, wie es bei robusten panels der Fall ist, kam es zu einer weit verbreiteten Falschdarstellung und Unterrepräsentation in den Daten. 

Now contrast that with Nielsen’s robust panels, which provide a wealth of directly collected information from real-life people, representative of the entire U.S. population. Who lives in the home?  How old are they? What race and ethnicity do they identify as? Who is watching the television at a given point in time? Nielsen’s panel answers these questions. 

Auch hier gilt, dass panels für sich genommen nicht perfekt sind, aber es gibt einen Grund, warum andere Branchen, insbesondere die Pharmaindustrie, bei der Zulassung von Arzneimitteln ähnliche Ansätze wie panels verwenden. Denn wenn viel auf dem Spiel steht, gibt es keinen Ersatz für echte, verifizierte Menschen.  

Wir wissen, dass viele Akteure der Branche von den Möglichkeiten von Big Data begeistert sind, und wir sind es auch. Aber als Branche müssen wir ehrlich darüber sein, was Big Data leisten kann und was nicht. Und auch wir wissen, dass die Zukunft der Medienmessung in einem Ansatz liegt, der die Reichweite von Big Data mit den verifizierten persönlichen Daten robuster panels kombiniert.

This article originally appeared on Next TV.

Fortsetzung der Suche nach ähnlichen Erkenntnissen

Unsere Produkte können Ihnen und Ihrem Unternehmen helfen