Kas yra duomenų gavyba?

Didžiosios įmonės žino daugiau apie jus, nei jūs negalėjote įsivaizduoti - štai kaip

Duomenų gavyba - didelių duomenų kiekio analizė siekiant atrasti modelius ir žinias. Iš tiesų, duomenų gavyba taip pat žinoma kaip duomenų atradimas ar žinių atradimas.

Duomenų gavyba naudoja statistinius duomenis, mašininio mokymosi (ML), dirbtinio intelekto (AI) ir daug duomenų (dažnai iš duomenų bazių ar duomenų rinkinių) principus, kad būtų galima identifikuoti modelius tokiu būdu, kuris būtų kuo labiau automatizuotas ir naudingas.

Ką Duomenų gavyba atlieka?

Duomenų gavyba turi du pagrindinius tikslus: aprašymą ir prognozavimą. Pirma, duomenų gavyba apibūdina įžvalgas ir žinias, gautus analizuojant duomenų modelius. Antra, duomenų gavyba naudoja pripažintų duomenų modelių aprašus būsimų modelių prognozavimui.

Pvz., Jei apsilankiusi apsipirkimo svetainėje apsilankius knygoms apie tai, kaip identifikuoti skirtingus augalų tipus, duomenų surinkimo tarnybos, dirbančios už tos svetainės scenų, užregistruos savo paieškų, susijusių su jūsų profiliu, aprašymą. Kai vėl prisijungsite po dviejų savaičių, svetainės duomenų gavybos paslaugos naudoja ankstesnių paieškų aprašymus, kad prognozuotų jūsų dabartinius interesus ir pasiūlytų individualizuotas pirkimo rekomendacijas, kuriose būtų knygų apie augalų identifikavimą.

Kaip veikia duomenų gavyba

Duomenų gavyba atliekama naudojant algoritmus, instrukcijų rinkinius, kurie pasakoja kompiuteriui ar procesą, kaip atlikti užduotį, norint atrasti skirtingus duomenų tipų modelius. Duomenų paieškai naudojami skirtingi modelio atpažinimo būdai apima klasterių analizę, anomalijų aptikimą, asociacijos mokymąsi, duomenų priklausomybę, sprendimų medžius, regresijos modelius, klasifikacijas, pašalinimus ir neuroninius tinklus.

Nors duomenų gavimas gali būti naudojamas aprašant ir prognozuojant visų skirtingų rūšių duomenų modelius, daugeliui žmonių dažniausiai susiduriama su naudojimu, net jei jie to nesupranta, - apibūdinti pirkimo būdų ir elgsenos modelius, siekiant prognozuoti tikėtiną ateities pirkimą sprendimai.

Pavyzdžiui, ar kada nors susimąstėte, kaip " Facebook" visada, atrodo, žino, ką pažvelgėte internete ir parodo savo žiniasklaidos skelbimus, susijusius su kitomis lankomomis svetainėmis ar savo žiniatinklio paieškas? "Facebook" duomenų mikroschemoje naudojama jūsų naršyklėje saugoma informacija, kuri stebi jūsų veiklą, pvz., Slapukus , kartu su savo žiniomis apie jūsų modelius, remiantis ankstesniu "Facebook" paslaugos naudojimu, kad galėtumėte sužinoti ir prognozuoti produktus ar pasiūlymus, kurie jums gali būti įdomūs.

Kokie duomenys gali būti išgauti?

Priklausomai nuo paslaugos ar saugyklos (fizinėse parduotuvėse taip pat naudojamas duomenų surinkimas), stebint kiekį duomenų apie jus ir jūsų modelius galite išgauti. Duomenys, surinkti apie jus, gali apimti kokios rūšies automobilį vairuojate, kur gyvenate, keliaudamas vietas, žurnalus ir laikraščius, kuriuos užsiprenumeravote, ir ar esate susituokę. Tai taip pat gali nustatyti, ar turite vaikų, kokios yra jūsų pomėgiai, kokia grupė tau patinka, savo politinius nuopelnus, tai, ką perkate internetu, ką perkate fizinėse parduotuvėse (dažnai naudodamiesi klientų lojalumo premijos kortelėmis) ir bet kokia dalijama informacija apie savo gyvenimą socialinėje žiniasklaidoje.

Pavyzdžiui, mažmenininkai ir mados leidiniai, skirti paaugliams, iš socialinių žiniasklaidos paslaugų, tokių kaip " Instagram" ir "Facebook", nuotraukų duomenų surinkimo nuotraukų, gali nuspėti mados tendencijas, kurios bus apsimestos paauglių pirkėjams ar skaitytojams. Duomenų gavybos metu atrasta įžvalga gali būti tokia tiksli, kad kai kurie mažmenininkai gali net nuspėti, ar moteris gali būti nėščia, atsižvelgiant į labai specifinius jos pirkimo pasirinkimo pokyčius. Pasakytina, kad mažmenininkas Target yra toks tikslus, nes prognozuoja nėštumą, atsižvelgdamas į istorijos supirkimo modelius, kad ji siunčia kūdikiams skirtus kuponus jaunai mergaitei, prieš pasakodami apie savo šeimos paslaptį, atskleisk savo nėštumo paslaptį.

Duomenų gavyba yra visur, tačiau didžioji dalis informacijos apie mūsų pirkimo įpročius, asmenines nuostatas, pasirinkimus, finansus ir internetinę veiklą naudojama parduotuvėse ir paslaugose siekiant sužinoti klientų patirtį.