Drew esiintyy Big Data Innovation Summit -tapahtumassa 30. ja 31. tammikuuta Las Vegasissa: http://analytics.theiegroup.com/bigdata-lasvegas yhdessä Obaman Amerikan puhujien, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs ja monet muut.
Rekisteröintilinkki: http://bit.ly/Zs3wms
Tämän haastattelun toteutti George Hill, ja se julkaistiin Big Data Innovation Magazine -lehdessä.
Millaista reaktiota on tapahtunut ennusteissasi?
Suurin osa reaktiosta on keskittynyt tarkkuuseroon meistä, jotka tutkimme yleisen mielipidekyselyn, ja suosittujen asiantuntijoiden ja kommentaattoreiden "suolistunnon" ennusteisiin. Minun kaltaiset tietoanalyytikot, Nate Silver (New York Times FiveThirtyEight -blogi), Simon Jackman (Stanford University ja Huffington Post) ja Sam Wang (Princetonin vaalikonsortio) asettivat vaalipäivänä Obaman uudelleenvalintamahdollisuudet yli 90%: iin ja ennustivat niitä oikein. Obama sai 332 äänestäjää todennäköisimmäksi tulokseksi. Sillä välin sellaiset selkäryhmät, kuten Karl Rove, George Will ja Steve Forbes, sanoivat Romneyn voittavan - ja joissain tapauksissa helposti. Tämä on johtanut puhumiseen "viettäjien voitosta", jonka toivon saavuttavan tulevissa vaaleissa.
Kuinka arvioit ennusteissasi käytetyn algoritmin?
Ennustemallini arvioi valtion äänestystulokset ja lopullisen vaaliäänestyksen kampanjan jokaisena päivänä kesäkuusta alkaen. Halusin, että näiden ennusteiden arviointi olisi mahdollisimman reilua ja objektiivista - eikä se jättäisi minua liikkumatilaan, jos ne olisivat väärin. Joten noin kuukautta ennen vaaleja postitin verkkosivuilleni kahdeksan arviointiperustetta, joita käyttäisin, kun tulokset olisivat tiedossa. Kuten kävi ilmi, malli toimi täydellisesti. Se ennusti kesän aikana, että Obama voittaa kaikki vuoden 2008 osavaltionsa, joista vähennetään Indiana ja Pohjois-Carolina, ja tuskin budjettikohti tästä ennusteesta, vaikka syyskuussa ylöspäin suuntautuneelle Obamalle annettiin tuki, jonka jälkeen se upotettiin ensimmäisen presidentin keskustelun jälkeen.
Sekä riippumattomien analyytikoiden että kampanjatiimien käytössä koko kampanjan aikana on ollut valtava määrä tietoja. Millaisia vaikutuksia tällä on tietojen käyttöön vuonna 2016?
Vuoden 2012 kampanja osoitti, että useita, monipuolisia kvantitatiivisia tietolähteitä voidaan hallita, luottaa ja soveltaa onnistuneesti moniin eri tarkoituksiin. Me ulkopuoliset pystyimme ennustamaan vaalituloksen kaukana etukäteen. Kampanjoiden sisällä tapahtui valtavia edistysaskeleita äänestäjien kohdistamisessa, mielipiteiden seurannassa, varainkeruussa ja äänestäjien osallistumisessa. Nyt kun tiedämme, että nämä menetelmät voivat toimia, mielestäni ei ole paluuta takaisin. Odotan, että toimittajat ja kampanjakommentaattorit ottavat kyselyjen yhdistämisen paljon vakavammin vuonna 2016. Ja vaikka Obamalla ja demokraateilla näyttää tällä hetkellä olevan etu kampanjateknologiassa, olisin yllättynyt, jos republikaanit eivät pääse nopeasti kiinni.
Luuletko, että tämän tietopohjaisen kampanjan menestys on merkinnyt sitä, että kampanjapäälliköiden on nyt oltava sekä analyytikko että strategia?
Kampanjapäälliköiden ei tarvitse olla itse analyytikoita, mutta heidän tulisi ymmärtää paremmin, kuinka tietoja ja tekniikkaa voidaan hyödyntää heidän edukseen. Kampanjat ovat aina käyttäneet kyselytutkimusta strategian muotoiluun ja äänestäjien mielipiteen mittaamiseen. Mutta nyt on saatavana joukko muita tehokkaita työkaluja: sosiaalisen verkostoitumisen verkkosivustot, äänestäjien tietokannat, matkapuhelimet ja sähköpostimarkkinointi vain muutaman mainitsemiseksi. Ja se on lisäksi viimeaikaisten edistysaskelten kyselymenetelmissä ja tilastollisen mielipiteen mallinnuksessa. Amerikkalaisessa kampanjapolitiikassa tapahtuu tällä hetkellä paljon innovaatioita.
Onnistuit ennustamaan vaalitulokset kuusi kuukautta etukäteen. Mikä on mielestäsi realistinen enimmäisaika tuloksen ennustamiseksi tarkasti analyysitekniikoillasi?
Noin neljä tai viisi kuukautta on suunnilleen taaksepäin, koska tiede antaa meidän mennä juuri nyt; ja se jopa työntää sitä vähän. Ennen sitä kyselyt eivät vain ole riittävän informatiivisia lopputuloksesta: liian monet ihmiset ovat joko epävarmoja tai eivät ole alkaneet kiinnittää huomiota kampanjaan. Historialliset taloudelliset ja poliittiset tekijät, joiden on osoitettu korreloivan vaalien tulosten kanssa, alkavat myös menettää ennustevoimansa, kun olemme ylittäneet suunnilleen 4–5 kuukauden rajan. Onneksi se antaa kampanjoille vielä paljon aikaa suunnitella strategiaa ja tehdä päätöksiä resurssien jakamisesta.