Gamtos kalbos apdorojimo technologijos programos

Kaip NLP formuos "Tech World" ateitį?

Natūralus kalbos apdorojimas arba NLP yra dirbtinio intelekto filialas, turintis daug reikšmingų pasekmių kompiuterių ir žmonių sąveikai. Žmonių kalba, sukurta per tūkstančius ir tūkstančius metų, tapo niuansine komunikacijos forma, kurioje pateikiama daug informacijos, kuri dažnai peržengia vien žodžius. NLP taps svarbia technologija, padedančia panaikinti atotrūkį tarp žmonių komunikacijos ir skaitmeninių duomenų. Čia yra 5 būdai, kaip natūralios kalbos apdorojimas ateinančiais metais bus naudojamas.

01 iš 05

Mašininis vertimas

Liam Norris / Stone / "Getty Images"

Kadangi pasaulinė informacija yra internete, užduotis tam, kad šie duomenys būtų prieinami, tampa vis svarbesnė. Iššūkis, kaip padaryti pasaulinę informaciją prieinamą visiems kalbos barjerams, tiesiog išaugo žmonių vertimo gebėjimai. Naujoviškos kompanijos, kaip "Duolingo", siekia įdarbinti didelį žmonių skaičių, prisidedant prie vertimo pastangų, mokančių naują kalbą. Tačiau mašininis vertimas suteikia dar labiau pritaikomą alternatyvą pasaulio informacijos suderinimui. "Google" yra mašininio vertimo pagrindinė įmonė, naudodama nuosavą statistinį "Google" vertimo paslaugos variklį. Problema, susijusi su mašininio vertimo technologijomis, yra ne vertimas žodžių, bet išsaugant sakinių reikšmę - sudėtingas technologinis klausimas, kuris yra NLP pagrindas.

02 iš 05

Kova su šlamštu

Šlamšto filtrai tapo svarbi pirmoji gynybos linija prieš vis didėjančią nepageidaujamo el. Pašto problemą. Tačiau beveik visi, kurie plačiai naudoja el. Laišką, patyrė agoniją dėl nepageidaujamų el. Laiškų, kurie vis dar yra gauti, arba svarbius el. Laiškus, kurie buvo atsitiktinai užfiksuoti filtru. Neteisingai teigiami ir klaidingai neigiami šlamšto filtro klausimai yra "NLP" technologijos pagrindas, o tai dar labiau susilygina su išraiškos ištraukimo reikšme iš teksto eilučių. Ypač daug dėmesio skiriama technologijai " Bayesian" šlamšto filtravimas, statistinė technika, pagal kurią žodžių dažnis el. Laiške yra matuojamas pagal tipišką šlamšto ir ne-šlamšto el. Pašto koresį.

03 iš 05

Informacijos išgavimas

Daugybė svarbių sprendimų finansų rinkose vis labiau atsilieka nuo žmonių priežiūros ir kontrolės. Algoritminė prekyba tampa vis populiaresnė, finansinių investicijų forma, kurią visiškai kontroliuoja technologija. Tačiau daugelį šių finansinių sprendimų daro įtaką naujienos - žurnalistika, kuri vis dar pateikiama daugiausia anglų kalba. Tada NLP pagrindinė užduotis pradėjo taikyti šiuos paprastus teksto skelbimus ir išgauti atitinkamą informaciją tokiu formatu, kuris gali būti įtrauktas į algoritminius prekybos sprendimus. Pavyzdžiui, naujienos apie įmonių susijungimą gali turėti didelės įtakos sprendimams dėl prekybos, o greitis, per kurį duomenys apie susijungimą, žaidėjus, kainas, kurie įsigyja, kurie gali būti įtraukti į prekybos algoritmą, gali turėti pelno milijonai dolerių.

04 iš 05

Apibendrinimas

Informacinė perkrova yra tikras reiškinys mūsų skaitmeniniame amžiuje, ir jau mūsų galimybės naudotis žiniomis ir informacija gerokai viršija mūsų sugebėjimą ją suprasti. Tai yra tendencija, kurioje nėra jokių lėtėjimo ženklų, todėl gebėjimas apibendrinti dokumentų reikšmę ir informaciją tampa vis svarbesnė. Tai svarbu ne tik leisti mums sugebėti atpažinti ir suvokti susijusią informaciją iš daugybės duomenų. Kitas pageidaujamas rezultatas - suprasti giliausias emocines reikšmes, pavyzdžiui, remdamiesi suvestiniais socialinės žiniasklaidos duomenimis , ar bendrovė gali nustatyti bendrąsias jausmo tendencijas dėl savo naujausio produkto pasiūlymo? Šis NLP filialas taps vis labiau naudingas kaip vertingas rinkodaros turtas.

05 iš 05

Klausimas Atsakymas

Paieškos sistemos įdeda pasaulio informacijos turinį į savo rankas, tačiau vis tiek iš esmės yra gana primityvios, kai kalbama apie tai, kaip iš tikrųjų atsakyti į konkrečius žmogaus kylančius klausimus. "Google" matė nusivylimą, kurį tai sukėlė vartotojai, kuriems dažnai reikia išbandyti įvairius paieškos rezultatus, norėdami rasti atsakymą. Didelė "Google" pastangų dalis NLP srityje buvo pripažinti natūralius kalbos klausimus, ištraukti reikšmę ir pateikti atsakymą, o "Google" rezultatų puslapio raida parodė šį dėmesį. Nors, be abejo, gerėja, tai išlieka pagrindinis iššūkis paieškos sistemoms ir viena iš pagrindinių natūralios kalbos apdorojimo tyrimų taikymo sričių.