02_Elements/Icons/ArrowLeft Zurück zu Einblicke

Einblicke > Publikum

Künstliche Intelligenz ist das Bindeglied zwischen Big Data und Messungen auf Personenebene

4 Minuten lesen | Mainak Mazumdar, Chief Data and Research Officer, Nielsen Global Media | Oktober 2019

Die Wahrheit bei Messungen war noch nie so wichtig wie heute. Deshalb ist die Wahrheit unser einziges Ziel. Aber es war noch nie so kompliziert, zu dieser Wahrheit zu gelangen. Während viele Big Data als Allheilmittel für Messungen in einer digital geprägten Welt ansehen, wissen wir, dass es nicht so einfach ist.

Nielsen’s panels have been the foundation of persons-level measurement for decades, and they remain so today. The growth of big data, however, can’t be ignored as a source of valuable information. But big data alone isn’t suitable for representative measurement. Think about when you change the channel on your TV. That change becomes part of big data, but there is no record of who made the change or who witnessed it.

To highlight the shortcomings of big data from a measurement perspective, we conducted an analysis in the U.S. earlier this year that compared set-top box data with set-top box data that we calibrated with Nielsen panel data. The analysis found that the uncalibrated data is inherently biased and underrepresents minority audiences.

Das soll jedoch nicht heißen, dass Big Data keinen Wert hat. Ganz im Gegenteil. Aber sie müssen sich auf eine grundlegende Wahrheit stützen. Hier kommen unsere panels und künstliche Intelligenz (KI) ins Spiel. Unsere panel - der Schlüssel zur Messung auf Personenebene - sind die perfekte Grundlage für das Training von Big Data.

Durch die Anwendung von KI nutzen wir Big Data, um unsere Messmöglichkeiten drastisch zu erweitern und gleichzeitig die Qualität und Repräsentativität zu wahren. KI ist heute ein wesentlicher Bestandteil unserer Messmethoden. So spielte sie beispielsweise eine entscheidende Rolle bei der Entwicklung unserer erweiterten Messmöglichkeiten für lokale TV-Märkte, die den Umfang von Big Data (Return Path Data {RPD} von TV-Geräten) mit vollständig repräsentativen panel kombinieren.

Als wir versuchten, RPD in unsere lokalen Messungen zu integrieren, identifizierten wir vier Schlüsselanwendungen von AI.

Erkennen von Datenmustern

Als wir nach Möglichkeiten suchten, die RPD in unsere Messungen zu integrieren, haben wir die mit der RPD verbundenen Einschränkungen durch so genannte "Common Homes"-Analysen ermittelt. Für diese Analysen, die auch heute noch durchgeführt werden, vergleichen wir die Abstimmdaten von Nielsen-Messgeräten mit den RPD-Abstimmdaten. Diese Analysen decken jeden Monat mehr als 5.000 Haushalte (12.000 Fernsehgeräte) ab und haben ergeben, dass die RPD einige Abstimmungen übersieht.

Um dieses Manko zu beheben, haben wir eine zum Patent angemeldete Technik entwickelt, die mit Hilfe von Klassifikatoren die Muster erkennt, die mit der fehlenden Abstimmung in RPD-Häusern verbunden sind. Von dort aus entfernen KI-Algorithmen diese Häuser von der Verwendung bei der Messung.

Wissen, wann Set-Top-Boxen eingeschaltet und Fernsehgeräte ausgeschaltet sind

Die Nielsen-Analysen zu Hause analysieren mehr als 77 Millionen Sendeminuten in einem bestimmten Monat und liefern damit aussagekräftige Erkenntnisse. Diese Abstimmung ist jedoch nicht immer genau. Zum Beispiel schalten die Leute ihre Set-Top-Boxen nicht immer aus, wenn sie ihr Fernsehgerät ausschalten. Die RPD stellt diese Situationen als Fernsehkonsum dar, obwohl niemand zuschaut.

Wir können diese Einschränkung überwinden, indem wir Deep Learning-Klassifikatoren einsetzen, um Situationen zu erkennen, in denen die Set-Top-Box eingeschaltet ist, während der Fernseher ausgeschaltet ist. Der Algorithmus entfernt dann die ungültige Einstellung aus der RPD.

Identifizierung von Haushaltsmerkmalen und demografischen Informationen aus dem RPD

Die RPD ist namen- und gesichtslos und kann keine demografischen Informationen liefern. Demografische Informationen sind entscheidend für die korrekte Darstellung aller Teile einer Bevölkerung. Und darüber hinaus bedeutet eine genaue Messung, dass man in der Lage ist, Menschen zu messen, nicht nur Haushalte.

Um die leistungsstarken Informationen in RPD-Haushalten zu erschließen, kalibrieren wir RPD mit den bekannten Merkmalen, demografischen Daten und Abstimmungsinformationen von mehr als 45.000 von Nielsen gemessenen Haushalten sowie mit von Dritten zugewiesenen Merkmalen und demografischen Daten. Anschließend fügen wir diese Eingaben einem zum Patent angemeldeten rekurrenten neuronalen Netzwerk und einer gemischt-ganzzahligen Programmiertechnik hinzu, die die Merkmale und die Demografie von RPD-Haushalten genau identifiziert. Dieser KI-Algorithmus ermöglicht es uns, die demografischen Merkmale der Personen und Haushalte genau zu erfassen. 

Bestimmung des Standorts der Set-Top-Box

Die panel liefern Informationen über die Zuschauer und den Standort. RPD stellt beides nicht zur Verfügung. Wir können diese Informationen jedoch über AI von RPD erhalten. Wir verwenden eine wissenschaftlich erprobte Methode, um festzustellen, welches Haushaltsmitglied fernsieht und wo im Haushalt gesehen wird.

Untersuchungen haben ergeben, dass der Standort des Raums einer der wichtigsten Prädiktoren dafür ist, welche Haushaltsmitglieder zu den Zuschauern gehören. Daher verwenden wir einen Klassifikator, um den Raum zu identifizieren, in dem sich die Set-Top-Box befindet und in dem die Abstimmung in den RPD-Haushalten stattfindet. Auf diese Weise können wir diese Variable bei der Zuschauerzuweisung verwenden.

Bei der Fülle an Informationen, die heute zur Verfügung stehen, ist es verlockend, Big Data durch eine rosarote Brille zu betrachten. Ohne eine Verbindung zu Personen sind Big Data jedoch alles andere als genau. Wir haben festgestellt, dass die künstliche Intelligenz ein wirksames Mittel ist, um Verzerrungen in Big Data zu beseitigen, und freuen uns, dass wir diese Innovation unseren Kunden vorstellen können. Diese Innovation profitiert sowohl von der Fülle an Informationen, die Big-Data-Quellen liefern, als auch von einem Wahrheitsgehalt, der sicherstellt, dass sie auf der Grundlage repräsentativer und genauer Daten planen, aktivieren und messen können.

This article first appeared on Medium.

Fortsetzung der Suche nach ähnlichen Erkenntnissen

Unsere Produkte können Ihnen und Ihrem Unternehmen helfen