Twitter algoritmo apibrėžimas

Kaip "Twitter" kompiuteriai perskaito tweets

Apibrėžimas:

"Smart" žmonės "Twitter" sukūrė super sudėtingą algoritmą, kad jų protingi kompiuteriai žinotų, kaip "perskaityti" gazilliono tweets, kuriuos jie stumia per "firehose".

Algoritmas, bet kuris algoritmas, yra naudojamas duomenims apdoroti, dažnai pateikiant juos į kibirą, kad bus padaryta galutinė išvada. Pavyzdžiui, kai ieškote kažko "Google" ar "Bing", paieškos rezultatai, kurie jums grąžinami, gaunami iš algoritmo.

Paieškos algoritmas nustatė, kad tai, ką jūs norite, remiantis jūsų paieška, yra tai, ką jie atskleidžia jums.

"Twitter" algoritmas, kuriame skaitomos ir rūšiuojamos "Tweets", leidžia "Twitter" išsiaiškinti, kas vyksta bet kur.

Pavyzdžiui, mirus Michael Jacksonui, jo mirtis buvo pirmoji, o vėliau dvi, tada keturios, tada šešios iš dešimties populiariausių temų. Ir tai buvo dvidešimt minučių iki vietos radijo stoties pranešta apie tai.

Kiekvienų metų pabaigoje "Twitter" paskelbia "Golden Tweets" puslapį, kuriame rodomi labiausiai tweets of the year. Tai duomenys, kuriuos jie niekada negalėtų išnagrinėti be konkretaus algoritmo, skirto šioms retweets skaičiavimui.

Kai "Twitter" pirmą kartą atskleidė naują "Discover" skirtuką, jie parašė apie algoritmą, naudojamą jo sukūrimui:

"Mes pradedame įdiegti naują skirtuko" Discover "versiją, kuri yra dar labiau pritaikyta tau. Mes patobulinome savo individualizavimo algoritmus, įtraukdami keletą naujų signalų, įskaitant paskyras, kurias sekite ir kam sekasi. Visi šie socialiniai duomenys yra naudojama suprasti jūsų interesus ir rodyti istorijas, kurios tinka jums realiuoju laiku.

Už scenų naująjį "Discover" skirtuką veikia "Earlybird", "Twitter" realaus laiko paieškos technologija. Kai vartotojas tweets, šis "Tweet" yra indeksuojamas ir tampa paieškos metu per kelias sekundes. Kiekvienas "Tweet" su nuoroda taip pat vykdo papildomą apdorojimą: ištraukiame ir išplėsime visus "Tweets" esančius URL, o tada įkelkite šių URL turinį per "SpiderDuck", mūsų realaus laiko URL gaviklį.

Norėdami sukurti istorijas, kurios yra pagrįstos jūsų socialine grafika ir kurios, mūsų nuomone, jums labiausiai įdomios, mes pirmiausia naudosime "Cassovary", mūsų grafikos apdorojimo biblioteką, kad identifikuotumėte jūsų ryšius ir suskirstytų juos pagal tai, kaip stiprūs ir svarbūs yra tie ryšiai.

Kai turėsime tą tinklą, mes naudosime "Twitter" lanksčią paieškos sistemą, kad galėtume rasti URL, kurie buvo bendri su tuo žmonių ratu. Šie saitai paverčiami istorijomis, kurias parodysime kartu su kitomis istorijomis skirtuke "Atviras". Prieš juos parodydami, paskutinis reitingo leidimas persiunčia istorijas pagal tai, kiek žmonių apie juos tweeted ir kaip šie žmonės yra susiję su jumis. Visa tai vyksta beveik realiuoju laiku, o tai reiškia, kad "break" ir svarbios istorijos atsiranda naujame skirtuke "Discover", kai tik žmonės pradeda kalbėti apie juos. "

Daugelis įmonių su algoritmais apdoroja tonus duomenų kasdien. Jei reikia, algoritmai dažnai atnaujinami. Pavyzdžiui, per pastaruosius kelerius metus "Google" atnaujino savo paieškos algoritmą (visur nerimaudamas dėl "SEO") daug kartų. Ką gausite kaip paieškos rezultatą šiandien bet kuriai paieškai yra labai mažai tikėtina, ką galėtumėte rasti prieš daugelį metų.

Pačios "Twitter" paieškos algoritmai patyrė neįtikėtinai dinamišką. Čia galite rasti žmonių, kurie konkrečiai klausia klausimą, naudoja "šypsenėlių veidą" ir žmones, kurie yra "Tweeting", būtent jūsų geografinėje vietovėje.

"Twitter" algoritmas neturi būti toks agresyvus, kaip "Google", bet jis tikrai tvirtas ir yra veiksmingai naudojamas kuriant naujus būdus peržiūrėti "Twitter" esamus duomenis.

Dažniausiai pasitaikantys rašybos klaidos:

twitter algorythm
Algoritmas