Otsingumootorid teavad, mida soovite… varem

Week 5, continued (Juuli 2019).

Anonim

Kui sisestate otsingumootorisse "Oklahoma", võite saada reisiloa, uudiseid naftatööstuse, Oklahoma riigi jalgpalli skooride kohta või artiklit Rodgersi ja Hammersteini muusikalide kohta. Loendi ülaosas kuvatav teave võib - ja peaks - sõltub sellest, mida te tegelikult otsisite.

Veebiotsingumootorid, sotsiaalse meedia saidid ja jaemüüjad, kes teile soovitusi pakuvad, teevad teie otsinguajaloo vaatamiseks otsingutulemusi mõnikord "isikupärasemaks".

"Kui ostate midagi Amazonast täna õhtul, siis võidakse homme tagasi tulla, võivad nad näidata teile seotud tooteid, " selgitas arvutiteaduse valdkonna kraadiõppur Wenlei Xie. "Nad on arvutanud pääseeringud offlainis, vastavalt teie valitud valikule."

Kuid nüüd on Xie ja tema kolleegid rafineerinud algoritmi (arvutiprogrammi aluseks olev disain), et muuta see kiiremaks, nii et otsingumootorid saavad interaktiivseks, reageerides teie huvidele reaalajas. Uus meetod on nende sõnul "murda kümme aastat vana täitmisbarjääri." Meetodeid saab rakendada sotsiaalmeedias, era- ja äriandmebaasides, samuti veebiotsingutes ja soovituste süsteemides.

Xie on esimene kirjanik, kes kirjeldas 21. sajandi ACM SIGKDD teadmiste avastamise ja andmete maavanemise konverentsil esitatud uudiseid, eelmisel suvel Sydneys, Austraalias, kus ta sai parima üliõpilaspaberi auhinna. Ta töötas koos arvutiteaduse professor Tischi ülikooli Johannes Gehrke'iga; David Bindel, arvutiteaduse dotsent; ja peamine teadur Alan Demers.

Teie otsinguajalugu võib visualiseerida kui graafikut. Arvutiteaduses ei ole see pigistatav joon, mis näitab, kuidas teie ettevõtte kasumid on langenud, vaid pigem mingi kontseptsiooni kaart, milles väikesed ringid, mida nimetatakse "sõlmedeks", kujutavad endast teavet, mis on ühendatud joontega "servad", mis esindavad suhteid. (Arvuti ei kasuta pilte. See lihtsalt salvestab andmeüksused ja seosed nende vahel. Inimesed teevad graafiku, mis aitab seda mõelda.)

Ajaloo uurimiseks teeb arvuti graafiku kaudu "juhuslikku jalutuskäiku", kuni see on kogu teabe lugenud. Jalutuskäigu juhtimiseks võib sõlmed ja servad olla "kaalutud". Noodid võivad registreerida, mitu korda olete külastanud seda veebisaiti või vaadanud seda toodet. Servad võivad näidata suhte tähtsust. Näiteks sotsiaalmeedias on "abikaasa" tugevam suhe kui "töökaaslane".

"Osakeste kaaluga" algoritmiga võib madala hinnatasemega sõlmede jalakäija maanduda juhuslikult teistele teistele, pakkudes teavet ainult kõige huvitavamate sõlmede kohta. Kuid "servade kaalumine" toimib paremini, ütlevad Cornelli teadlased.

Twitteris rõhutavad nad, et kui järjestada, kui kahel inimesel on ühised huvid, on paremad tulemused kui lihtsalt vaadates teemasid, millele iga kasutaja häältub.

Juba on olemas järjestuses kasutatavad algoritmid, mis kasutavad servakaalu, kuid need on aeglane. Selle kiirendamiseks vähendavad teadlased graafikut ja muudavad kõndimise kiiremaks - nagu näiteks Ameerika Ühendriikide kaardil, mis näitab ainult riikidevahelisi maanteid, mitte kõiki maakonna teid ja linna tänavaid.

Algoritm otsib sõlmed, mis on "korrelatsioonis" ja esindavad sarnaseid huve ja omavahel tihedaid sidemeid. Kõrgkooli üliõpilane, kes kontrollib kolleege, võib külastada palju ülikoolide veebisaite; neid saab lihtsustatud graafi abil ühendada üheks suureks ja väga oluliseks sõlmeks. "See on nagu me saame kokku murda miljoni sõlme 100 virtuaalseks sõlmeks, " selgitas Xie.

Uurijad katsetasid oma meetodit teaduslike väljaannete andmebaasist ja ajaveebi otsingusüsteemist ning leidsid, et see töötas viie järku ulatuses kiiremini kui praegu kasutatavad meetodid. Nad leidsid ka, et nende vähendatud mudel kiirendas süsteemide "õppimist auastama", kus arvuti märgib, milliseid elemente loendis kasutaja klõpsab, et saada ülevaade kasutaja eelistustest.

Teadlased soovitasid tulemusi veelgi õigeaegsemaks tegema, võib-olla teha arvutusi kliendi poolel, pärast vähendatud mudeli allalaadimist kliendi arvutisse. Samuti sooviksid nad vähendatud mudelit pidevalt värskendada uute andmetega.

menu
menu