Kaip naudotis "Ngram Viewer" įrankiu "Google" knygose

Ngram, taip pat dažnai vadinamas N-gramu, yra teksto ar kalbos turinio statistinė analizė, leidžianti rasti n teksto tam tikros rūšies elementą (skaičių). Tai gali būti įvairūs dalykai, pavyzdžiui, fonemai, priešdėliai, frazės ar raidės. Nors N-gramas yra šiek tiek neaiškus už mokslininko ribų, jis iš tikrųjų naudojamas įvairiose srityse, ir tai turi daug pasekmių žmonėms, kurie kuria kompiuterines programas, kurios supranta ir reaguoja į natūralią kalbinę kalbą. Trumpai tariant, "Google" susidomėjo šia idėja.

"Google Books Ngram Viewer" atveju analizuojamas tekstas gaunamas iš didžiulės knygų, kurias "Google" nuskaito iš viešųjų bibliotekų, kad būtų užpildyta " Google" knygų paieškos sistema. "Google Books Ngram Viewer" jie nurodo tekstą, kurį ketinate ieškoti kaip "korpuso". "Ngram Viewer" korpusas yra suskirstytas pagal kalbą, tačiau jūs galite atskirai analizuoti britų ir amerikietiškų anglų kalbą arba juos sujungti. Tai galų gale yra labai įdomu perjungti iš britų į amerikiečių terminų vartojimą ir pamatyti diagramas.

Kaip veikia "Ngram"

  1. Eikite į "Google Books Ngram Viewer" adresu books.google.com/ngrams.
  2. Skirtingai nei "Google" žiniatinklio paieškos, elementai yra didžiosios ir mažosios raidės, todėl būtinai naudokite reikšmingus daiktavardžius.
  3. Įveskite bet kokią frazę ar frazes, kurias norite analizuoti. Būtinai atskirkite kiekvieną frazę kableliu. "Google" siūlo "Alberto Einšteino, Šerloko Holmso, Frankenstein", kad pradėtumėte.
  4. Tada įveskite dienų seką. Numatyta nuo 1800 iki 2000, tačiau yra ir daugiau naujausių knygų (2011 m. Buvo naujausi išvardyti "Google" dokumentuose, tačiau jie galėjo pasikeisti.)
  5. Pasirinkite korpusą. Galite ieškoti užsienio kalbos tekstų ar anglų kalbos, o be standartinių pasirinkimų galite pastebėti apačioje tokius dalykus kaip "Anglų k. (2009)" arba "Amerikos anglų k. (2009)". Tai senesni korporai, kuriuos "Google" atnaujino, tačiau gali būti priežasčių palyginti senus duomenų rinkinius. Daugelis vartotojų gali ignoruoti juos ir sutelkti dėmesį į naujausias korpusas.
  6. Nustatykite lyginimo lygį. Smoothing reiškia, kaip sklandžiai grafika yra pabaigoje. Tiksliausias pateikimas būtų lyginamasis lygis 0, bet tai gali būti sunku perskaityti. Numatytoji reikšmė yra 3. Daugeliu atvejų jums nereikia koreguoti.
  1. Paspauskite mygtuką Ieškoti daug knygų . (Taip pat galite tiesiog paspausti enter įveskite paieškos užklausą.)

Kas rodomas Ngram?

"Google Books" "Ngram Viewer" išves iš grafiko, kuris parodo konkrečios frazės naudojimą knygose per laiką. Jei įvedėte daugiau nei vieną žodį ar frazę, kontrastingos skirtingos paieškos terminų pamatysite spalvines eilutes. Tai gana panaši į " Google Trends" , tik paieškos trukmė ilgesnė.

Štai realaus gyvenimo pavyzdys. Neseniai mums buvo įdomu apie acto pyragus. Jie paminėti Laura Ingallso Wilderio " Little House" "Prairie" serijoje, bet nieko apie tai negirdėjome. Pirmiausia naudodamiesi " Google" žiniatinklio paieška , sužinokite daugiau apie acto pyragus. Matyt, jie laikomi Amerikos Pietų virtuvės dalimi ir yra pagaminti iš acto. Jie klausosi atgal į tuos laikus, kai ne visuose metų laiku jie negalėjo gauti šviežių produktų. Ar tai visa istorija?

Mes ieškojome "Google Ngram Viewer", o dešimtojo dešimtmečio pradžioje ir pabaigoje yra keletas pyrago paminėjimų, daug kartų paminėta 1940-aisiais ir pastaruoju metu vis dažniau paminėta (galbūt kažkokia nostalgija). Na, yra keletas problema su duomenimis lygiu 3 lygiu. Virš paminklų yra 1800 m. Žinoma, kasmet penkerius metus nebuvo vienodo skaičiaus minėtų vienetų? Kas vyksta, tuo metu, kai tuo metu nėra daug knygų, o mūsų duomenys yra lygūs, tai iškreipia vaizdą. Tikriausiai buvo viena knyga, kurioje paminėta acto pyragas, ir ji buvo vidutiniškai, kad būtų išvengta spike. Nustatydami lyginimą iki 0, matome, kad tai būtent taip. Smegenų centrai yra 1869 m., O dar vienas smailis - 1897 m. Ir 1900 m.

Ar likusį laiką niekas nekalbėjo apie acto pyragaičius? Jie tikriausiai kalbėjo apie tuos pyragus. Tikėtina, kad receptai plaukioja visur. Jie tiesiog apie juos neprašė knygose, ir tai yra šių "Ngram" paieškų apribojimas.

Išplėstinė paieška Ngram

Prisimink, kaip sakėme, kad "Ngrams" gali būti įvairių rūšių teksto paieškų? "Google" leidžia šiek tiek sužinoti ir "Ngram Viewer". Jei norite ieškoti žuvų veiksmažodžio vietoj žuvies, galite tai padaryti naudodami žymes. Tokiu atveju ieškosite "fish_VERB"

"Google" pateikia išsamų komandų, kurias galite naudoti, sąrašą ir kitus papildomus dokumentus jų svetainėje.