La frode nei panel è la nuova frode pubblicitaria? Il problema allarmante che affligge le ricerche di mercato viene risolto grazie all'intelligenza artificiale.

La qualità dei dati è fondamentale per i CMO che devono ricavare informazioni approfondite: l'89% degli acquirenti concorda infatti sul fatto che si tratti della loro priorità assoluta. In questo articolo illustriamo la situazione attuale in materia di frodi e spieghiamo come Kantar possa risolverla grazie all'intelligenza artificiale e ad altre soluzioni avanzate.

La qualità dei dati è fondamentale per i CMO che devono ricavare informazioni approfondite, con l’89% degli acquirenti che concorda sul fatto che sia la loro priorità numero uno (fonte: Greenbook, 2023 GRIT Insights Practice Report).

Un recente impegno di qualità nel settore sta prendendo piede man mano che un numero crescente di acquirenti, venditori e fornitori comprende che questo problema deve essere risolto.

Come afferma Jane Frost, CEO della Market Research Society:“Le attività fraudolente stanno diventando sempre più sofisticate, in particolare nella ricerca online. Rappresentano un rischio significativo per il futuro del nostro settore.”

La qualità dei dati dovrebbe essere un fattore fondamentale su cui gli acquirenti di insight possano fare affidamento, ma la frode dilagante persiste da anni. Ed è un argomento stranamente poco discusso in tutto il settore. La frode nei panel sta assumendo le sembianze della frode pubblicitaria o delle click farm di questo decennio – e si sta industrializzando rapidamente.

Quel che è peggio, con l'aumentare dei casi di frode, aumentano anche le variazioni nei dati che ne derivano.

In questo articolo, facciamo luce sul fenomeno delle frodi e su come Kantar possa risolverlo grazie all’intelligenza artificiale e ad altre soluzioni avanzate.

A livello globale, esistono tre grandi sfide di settore che interessano i panel:

1. La lotta per l’attenzione: come possiamo competere per conquistare il tempo prezioso dei partecipanti al panel?
2. Requisiti sempre più stringenti in materia di protezione dei dati: il GDPR, ad esempio, è diverso dal CPPA.
3. Livelli crescenti di frodi online. I "tassi di riconciliazione" - la percentuale di campioni rifiutati perché di bassa qualità - sono aumentati di circa il 300% negli ultimi tre anni, e i clienti rifiutano fino al 40% dei dati dopo la raccolta.

I gestori dei panel devono affrontare ciascuno di questi tre fattori in modo intelligente e strategico.

1. Conquistare l'attenzione del pubblico

Tutto inizia dal modo in cui trattiamo i nostri panelisti: non come una merce, ma come una risorsa preziosa. Cerchiamo costantemente di migliorare il modo in cui poniamo le domande, la durata dell’intervista (LoI) e come aumentare la gamification. Consideriamo i nostri panelisti come persone, rispondendo alle loro domande e trattandoli con rispetto. Abbinamo ogni singolo panelista tramite il nostro esclusivo algoritmo di abbinamento dei sondaggi, in modo che le persone giuste rispondano ai sondaggi giusti, al ritmo giusto. Questo aiuta a ridurre gli abbandoni e gli scarti e si traduce in un aumento del 175% dei sondaggi completati rispetto alla media del settore. Combinando il nostro approccio di trattare i partecipanti come persone apprezzate con una tecnologia avanzata per i panel, scopriamo che i nostri panelisti sono felici e coinvolti. Valutano la nostra app con un 4,2 su Trustpilot e lasciano recensioni positive come: "L'energia è positiva e ho imparato tantissimo dai sondaggi online, mentre anche il mio conto in banca continua a sorridere!"

2. Requisiti sempre più rigorosi in materia di protezione dei dati

Kantar ricopre un ruolo di primo piano nei dibattiti di settore e nei gruppi di lavoro (ad esempio, ESOMAR). Disponiamo inoltre di un team interno di specialisti che monitora costantemente le normative in materia di privacy e consenso, garantendo che disponiamo delle soluzioni tecniche adeguate per la raccolta, l'archiviazione e la cancellazione dei dati.

In Cina, ad esempio, disponiamo di una piattaforma specifica per la gestione dei campioni conforme alla PIPL per la raccolta dati approvata dal CAC, che offre una serie di ottimizzazioni specifiche per il mercato. È interamente contenuta nel cyberspazio cinese e garantisce l'accesso programmatico al nostro panel mobile WeChat di proprietà esclusiva: l'accesso a 1,5 milioni di persone più difficili da raggiungere. Disponiamo inoltre di molteplici livelli di prevenzione delle frodi e di controlli di qualità che assicurano che ogni account WeChat sia collegato a un conto bancario reale e unico. Gli ID con hash e i link ai sondaggi sono crittografati con MD5 e Wave Secret, per mitigare i completamenti fantasma e le risposte fraudolente da parte degli hacker.

3. L'aumento dei casi di frode online

Oltre due terzi dei segnali relativi alla qualità dei dati (69%) sono attribuibili a diversi tipi di frode. Di questi, il 41% proviene da hacker internazionali, il 13% da bot noti, il 7% da completamenti fantasma (in cui un intervistato sembra aver completato un sondaggio ma non vengono raccolti dati a causa dell'impostazione di link reindirizzati) e l'8% da duplicati (in cui un intervistato completa più sondaggi, solitamente se ha creato molti account fraudolenti fingendo di appartenere a diversi gruppi demografici).

Per garantire la massima qualità dei dati, abbiamo segmentato le frodi in tre tipi:

• Panelisti disinteressati: svolgono più attività contemporaneamente, rispondono in modo meccanico ai sondaggi, quindi l'accuratezza è discutibile. L'impatto sull'integrità dei dati è da moderato a basso. Questi panelisti necessitano di guida e monitoraggio del comportamento. Potrebbe essere necessario escluderli da determinati studi.

• Partecipanti disonesti: mentono sulla propria identità e completano più sondaggi per guadagnare premi più velocemente. L'impatto sull'integrità dei dati è da moderato ad alto.

• Partecipanti fraudolenti: agiscono da soli o in gruppo per hackerare i sondaggi e guadagnare premi in massa – le nuove "click farm", se volete. Si tratta di una frode grave, su larga scala, con un forte impatto sull'integrità dei dati.

Cosa sta facendo Kantar per contrastare ciascuno di questi tipi di frode? E in che modo stiamo utilizzando strumenti di IA e IA generativa all'avanguardia per combatterli?

• Promuoviamo una buona progettazione dei sondaggi: la qualità di un sondaggio dipende dalla struttura, dalla lunghezza e dall’esperienza dell’utente. Anche i partecipanti più coinvolti possono perdere interesse se questi fattori non vengono considerati.

• Preveniamo gli errori dovuti alla disattenzione: alcuni membri del panel danno risposte incoerenti a causa di fraintendimenti, e alcuni non sono chi dicono di essere; tuttavia, non tutti i problemi segnalati derivano da un inganno intenzionale. Alcuni sono errori innocenti, e non tutte le azioni segnalate compromettono l’integrità dei dati. Vogliamo includere tutti i partecipanti in buona fede. Pertanto, forniamo ai partecipanti alla ricerca una formazione e, se necessario, la possibilità di migliorare il loro comportamento.

• Definiamo la qualità: è soggettiva, quindi utilizziamo metriche oggettive. È fondamentale riconoscere i vari livelli di scarsa qualità e i diversi fattori che contribuiscono a determinarla. La divisione Profiles di Kantar potenzia i suoi oltre 20 anni di profonda esperienza nel settore dei panel con la tecnologia e l’intelligenza artificiale per farlo in tempo reale tramite Qubed AI, il suo strumento antifrode proprietario. Qubed AI funziona in tempo reale, è alimentato da 5 reti neurali profonde (in altre parole, machine learning avanzato), viene addestrato quotidianamente sulla base di oltre 60 milioni di eventi ed elabora più di 300 caratteristiche per ogni sessione di sondaggio per assegnare automaticamente un punteggio e fornire un verdetto e un'azione suggerita sul fatto che un partecipante al panel sia fraudolento o meno, nel giro di pochi millisecondi – qualcosa che un essere umano (e altre tecnologie antifrode) semplicemente non potrebbero fare.

• Utilizziamo GenAI con la validazione a risposta aperta di Qubed: utilizziamo la nostra soluzione proprietaria di valutazione a risposta aperta basata su ChatGPT che valuta le risposte aperte dei partecipanti al sondaggio su più dimensioni. I fattori che rileviamo includono la pertinenza alla domanda posta, l'originalità, la completezza, il linguaggio, le risposte plagiate, l'uso di dati personali, il gergo, l'uso di abbreviazioni, nonché parolacce, razzismo, discorsi senza senso e risposte generate da ChatGPT. Per ulteriori informazioni su come Qubed Open-End Validation di Kantar combatte le frodi, consultate questo nostro precedente articolo intitolato " Trasformare i panel: in che modo Kantar utilizza gli LLM per migliorare le risposte dei panel?"

• Introduzione della verifica facciale Qubed: l'ultimo passo avanti di Kantar nella lotta alle frodi nei sondaggi è stata l'integrazione di Realeyes Verify nella nostra Qubed AI. Verify è una tecnologia di verifica facciale leggera addestrata su un dataset unico di webcam composto da 17 milioni di sessioni di sondaggio con consenso. Siamo in grado di identificare rapidamente quando malintenzionati tentano di entrare a far parte dei nostri Premium Panel.

I CMO e i responsabili degli Insights devono comprendere in che modo i loro partner di panel danno priorità alla qualità dei dati e avere la certezza che forniscano dati tempestivi e accurati, non viziati da risposte fraudolente.

Mentre l’intero settore abbraccia la qualità attraverso il Quality Pledge e altri mezzi, Kantar è ben posizionata per continuare il suo ruolo di leadership nell’eliminazione delle frodi e nel restituire maggiore fiducia al settore dei dati sui consumatori, attraverso l’uso intelligente dell’IA.

‍

La frode nei sondaggi è la nuova frode pubblicitaria? Il problema allarmante che affligge il settore delle ricerche di mercato viene risolto grazie all'intelligenza artificiale.

1. Conquistare l'attenzione del pubblico

2. Requisiti sempre più rigorosi in materia di protezione dei dati

3. L'aumento dei casi di frode online

Cosa sta facendo Kantar per contrastare ciascuno di questi tipi di frode? E in che modo stiamo utilizzando strumenti di IA e IA generativa all'avanguardia per combatterli?