Paieškos sistemų principai. Interneto paieškos sistemos

Turinys:

Paieškos sistemų principai. Interneto paieškos sistemos
Paieškos sistemų principai. Interneto paieškos sistemos
Anonim

Internete, įvairiose svetainėse vartotojui siūloma daug įvairios informacijos. Sukurtos paieškos sistemos, leidžiančios gauti reikiamą informaciją, ieškoti atsakymų į klausimus. Išgirdę šią frazę daugelis žmonių galvoja apie Google, Yandex. Tačiau internete yra daug daugiau paieškos sistemų.

Kas yra paieškos variklis

Paieškos variklis laikomas programine įranga, kurią sudaro dokumentų duomenų bazė. Vartotojams suteikiama speciali sąsaja, leidžianti įvesti reikiamas užklausas ir gauti nuorodas su aktualia informacija. Dokumentai, kurie labiausiai atitinka tai, ko ieško konkretus asmuo, visada yra paieškos rezultatų viršuje.

Paieškos rezultatuose, kurie generuojami pagal įvestą užklausą, paprastai yra skirtingų tipų rezultatai. Jame gali būti tinklalapių, vaizdo ir garso failų, paveikslėlių, pdf failų, konkrečių produktų (jei paieška atliekama internetinėje parduotuvėje).

Paieškos sistemų reitingas pasaulyje
Paieškos sistemų reitingas pasaulyje

Paieškos sistemų klasifikacija

Esamos paieškos sistemos skirstomos į keletą tipų. Visų pirma, verta paminėti tradicines paieškos sistemas. Tokių paieškos sistemų darbo principai yra orientuoti į informacijos paiešką daugybėje esamų svetainių. Paieškos varikliai vis dar pasiekiami atskiruose interneto š altiniuose:

  • internetinėse parduotuvėse (tinkamų prekių paieškai);
  • forumuose ir tinklaraščiuose (įrašų paieškai);
  • informacijos svetainėse (norint ieškoti straipsnių norima tema ar naujienomis) ir kt.

Paieškos varikliai taip pat skirstomi pagal geografines ypatybes. Šioje klasifikacijoje yra 3 paieškos sistemų grupės:

  1. Visuotiniai. Paieška vykdoma visame pasaulyje. Šios grupės lyderis yra Google paieškos sistema. Anksčiau buvo paieškos sistemų, tokių kaip Inktomi, AltaVista ir kt.
  2. Regioninis. Paieška atliekama pagal šalį ar šalių grupę, kurias vienija viena kalba. Regioninės paieškos sistemos yra plačiai paplitusios. Jų pavyzdys Rusijoje yra „Yandex“, „Rambler“.
  3. Vietinis. Paieška atliekama konkrečiame mieste. Tokios paieškos sistemos pavyzdys yra Tomsk.ru.

Paieškos sistemų komponentai

Bet kuriame paieškos variklyje yra 3 sudedamieji elementai, lemiantys paieškos variklio veikimo principus:

  • robotas (indekseris, voras, vikšrinis robotas);
  • duomenų bazė;
  • užklausų tvarkytojas.

Robotas yra speciali programa, kurios tikslas yra suformuoti duomenų bazę. Duomenų bazė saugo ir rūšiuojavisa surinkta informacija. Užklausų tvarkytuvas, dar vadinamas klientu, dirba su vartotojų užklausomis. Jis turi prieigą prie duomenų bazės. Klientas ne visada yra tame pačiame kompiuteryje. Užklausų tvarkytuvas gali būti paskirstytas keliuose fiziškai nesusijusiuose elektroniniuose kompiuteriuose.

Darbas paieškos sistemomis
Darbas paieškos sistemomis

Paieškos sistemų principai

Visos esamos sistemos veikia tuo pačiu principu. Apsvarstykite, pavyzdžiui, tradicinių paieškos sistemų, sukurtų internetui, veikimą. Roboto veikimas panašus į įprasto vartotojo veiksmus. Ši programa periodiškai apeina visas svetaines, į duomenų bazę įtraukia naujų puslapių ir interneto išteklių. Šis procesas vadinamas indeksavimu.

Kai vartotojas internete į paieškos laukelį įveda tam tikrą užklausą, klientas pradeda dirbti. Programa pasiekia esamą duomenų bazę ir generuoja rezultatus pagal raktinius žodžius. Paieškos sistema pateikia nuorodas į vartotoją tam tikra seka. Jie rūšiuojami taip, kaip atitinka užklausą, t. y. atsižvelgiama į aktualumą.

Kiekviena paieškos sistema gali savaip nustatyti tinkamumą. Jei vartotojas siunčia konkrečią užklausą skirtingoms sistemoms, jis gaus ne visiškai tuos pačius rezultatus. Aktualumo nustatymo algoritmas laikomas paslaptyje.

Populiariausios paieškos sistemos Rusijoje
Populiariausios paieškos sistemos Rusijoje

Išsami aktualumo informacija

Paprastais žodžiais tariant, aktualumas yra žodžio ar žodžių junginio, įvesto į paiešką, atitikimaskonkrečios nuorodos SERP. Kai kurie niuansai turi įtakos dokumentų vietai sąraše:

  1. Paieškos žodžių buvimas dokumentuose. Šis niuansas yra akivaizdus. Jei dokumente yra žodžių iš vartotojo įvestos užklausos, tai reiškia, kad šis dokumentas atitinka paieškos sąlygas.
  2. Žodžių atsiradimo dažnis. Kuo dažniau dokumente naudojami raktiniai žodžiai, tuo aukščiau jis bus SERP sąraše. Tačiau ne viskas taip paprasta. Per didelis žodžių vartojimas gali būti prastos kokybės turinio ženklas paieškos varikliui.

Aktualumo nustatymo algoritmas yra gana sudėtingas. Prieš keletą metų į paieškos rezultatus galėjo patekti nuorodos, kuriose buvo reikalingi raktiniai žodžiai, bet jų turinys neatitinka. Šiuo metu paieškos sistemų veikimo principai yra sudėtingi. Dabar robotai gali analizuoti visą tekstą. Paieškos sistemos atsižvelgia į daugybę skirtingų veiksnių. Dėl to numeris formuojamas iš aukščiausios kokybės, aktualių nuorodų.

Kaip teisingai suformuluoti užklausas

Net mokykloje mus mokė teisingai užduoti klausimus. Tai priklauso nuo to, kokius atsakymus gausime. Tačiau naudojant paieškos sistemas šios taisyklės laikytis nereikia. Šiuolaikinėms paieškos sistemoms nesvarbu, kokiu numeriu ar kokiu atveju žmogus parašo savo prašymą. Bet kuriuo atveju išvestyje bus pateikti tie patys rezultatai.

Paieškos sistemoms nereikia aiškios klausimo formuluotės. Vartotojui tereikia pasirinkti tinkamus raktažodžius. Apsvarstykite pavyzdį. Mums reikia rastidainos „A Day Without You“tekstas, kurį atlieka garsi moterų pop grupė „Via-Gra“. Kreipdamiesi į paieškos sistemą, nebūtina įvardyti grupės, nurodyti, kad tai daina. Pakanka parašyti „diena be tavęs teksto“. Laikyti didžiąsias ir mažąsias raides, skyrybos ženklų nereikia. Į šiuos niuansus neatsižvelgia paieškos sistemos.

Taisyklinga užklausų formuluotė
Taisyklinga užklausų formuluotė

Paieškos sistemų reitingas pasaulyje

Pirmiausia paieškos sistema pasaulyje yra „Google“. Ji buvo įkurta 1998 m. Sistema yra labai populiari, tai patvirtina ir analitinė informacija. Apie 70 % į internetą gaunamų užklausų apdoroja Google. Paieškos sistemos duomenų bazė yra didžiulė. Indeksuota daugiau nei 60 trilijonų įvairių dokumentų. „Google“pritraukia vartotojus paprasta sąsaja. Pagrindiniame puslapyje yra logotipas ir paieškos juosta. Ši funkcija leidžia mums vadinti „Google“viena minimalistiškiausių paieškos variklių.

Bing yra antra pagal populiarumą paieškos sistema. Jis pasirodė tais pačiais metais kaip ir Google. Šios paieškos sistemos kūrėja yra gerai žinoma tarptautinė korporacija „Microsoft“. Žemesnes pozicijas reitinge užima Baidu, Yahoo!, AOL, Excite, Ask.

Paieškos sistemos principai
Paieškos sistemos principai

Kas populiaru Rusijoje

Yandex yra populiariausia paieškos sistema Rusijoje. Ši paslauga pasirodė 1997 m. Iš pradžių tuo užsiėmė Rusijos įmonė „CompTek International“. Šiek tiek vėliau pasirodė „Yandex“įmonė, kuri ir toliau užsiėmė paieškos sistema. Paieškos variklis, skirtasgyvavimo metų sulaukė didžiulio populiarumo. Galima ieškoti keliomis kalbomis – rusų, b altarusių, ukrainiečių, totorių, kazachų, anglų, vokiečių, prancūzų, turkų.

Iš statistinių duomenų žinoma, kad „Yandex“domina daugiau nei 50 % Runet vartotojų. Daugiau nei 40 % žmonių teikia pirmenybę „Google“. Maždaug 3 % vartotojų pasirinko Mail.ru – rusakalbį interneto portalą.

Google paieškos sistema
Google paieškos sistema

Apsaugoti paieškos varikliai

Įprastos mums žinomos paieškos sistemos nėra visiškai tinkamos vaikams. Jaunieji internautai gali netyčia rasti medžiagos, skirtos suaugusiems, informacijos, kuri gali pakenkti psichikai. Dėl šios priežasties buvo sukurtos specialios saugios paieškos sistemos. Jų duomenų bazėse yra tik saugus vaikams skirtas turinys.

Vieno tokio paieškos variklio pavyzdys yra Sputnik. Vaikai. Ši paslauga yra gana jauna. Jį sukūrė Rostelecom 2014 m. Pagrindinis paieškos sistemos puslapis yra ryškus ir įdomaus dizaino. Jame pristatomas platus vietinių ir užsienio animacinių filmų įvairaus amžiaus vaikams pasirinkimas. Be to, pagrindiniame puslapyje yra informacinės nuorodos, susijusios su keliomis antraštėmis – „Sportas“, „Noriu viską žinoti“, „Pasidaryk pats“, „Žaidimai“, „Technologijos“, „Mokykla“, „Gamta“.

Kitas saugios vaikų paieškos sistemos pavyzdys yra Agakids.ru. Tai visiškai saugus š altinis. Kaip veikia paieškos sistema? Robotas sukonfigūruotas taip, kad aplenktų tik tas svetaines, kurios yra susijusios su vaikų temomis arbayra naudingi tėvams. Paieškos sistemos duomenų bazėje yra ištekliai su animaciniais filmais, knygomis, mokomąja literatūra, žaidimais, spalvinimo knygelėmis. Tėvai, naudodami Agakids.ru, gali patys susirasti svetaines apie vaikų auklėjimą ir sveikatą.

Apsaugotos paieškos sistemos vaikams
Apsaugotos paieškos sistemos vaikams

Apibendrinant verta paminėti, kad paieškos sistemos yra sudėtingos sistemos. Jie susiduria su daugybe problemų – šiukšlių, dokumentų aktualumo nustatymo, nekokybiško turinio atrankos, dokumentų, kuriuose nėra tekstinės informacijos, analizės. Dėl šios priežasties kūrėjai į interneto paieškos sistemų darbą diegia naujus metodus ir algoritmus, kurie yra komercinė paslaptis.

Rekomenduojamas: