Napredno pretraživanje i jezik upita. Jezik tražilice
Jezik upita je umjetno izrađen programski jezik koji se koristi za upite u bazama podataka i informacijskim sustavima.
sadržaj
Općenito, takve metode upita se mogu klasificirati ovisno o tome da li se koristi za baze podataka, ili tražiti informacije. Razlika je u tome što su zahtjevi za takvim uslugama nastojimo pružiti činjenične odgovore na ta pitanja, a tražilice pokušava pronaći dokumente koji sadrže informacije o korisniku zainteresiran u polju.
baze podataka
Jezični jezici za baze podataka uključuju sljedeće primjere:
- QL - objektno orijentiran, odnosi se na relacijske baze podataka- nasljednik Dataloga.
- Kontekstualni (CQL) je formalni jezik prikazivanja upita za sustave prikupljanja informacija (kao što su web indeksi ili bibliografski direktori).
- CQLF (CODYASYL) - za CODASYL-TYPE baze podataka.
- Konceptno orijentirani jezik upita (COQL) koristi se u odgovarajućim modelima (com). Temelji se na načelima modeliranja podataka konstrupt i koristi takve operacije kao projekcija i de-projekcija višedimenzionalne analize, analitičkih operacija i zaključaka.
- DMX - koristi se za modele podataka miniranja.
- Datalog je jezik upita za deduktivne baze podataka.
- Gellish English je jezik koji se može koristiti za upite u Gellish English bazama podataka i omogućuje vam da vodite dijaloge (upite i odgovore), a služi i za modeliranje informacija znanje.
- HTSQL - prevodi HTTP zahtjeve u SQL.
- ISBL - koristi se za PRTV (jedan od prvih relacijskih sustavi upravljanja bazom podataka).
- LDAP je protokol za zahtjeve i usluge direktorija koji pokreće TCP / IP.
- MDX je potreban za OLAP baze podataka.
Tražilice
Jezik upita za pretraživanje, zauzvrat, ima za cilj pronalaženje podataka u tražilicama. Razlikuje se u tome da često zahtjevi sadrže običan tekst ili hipertekst s dodatnom sintaksom (na primjer, "i" / "ili"). Ono se značajno razlikuje od standardnih sličnih jezika, koji su regulirani sa strogim pravilima zapovjedne sintakse ili sadrže pozicijske parametre.
Kako se upiti za pretraživanje klasificiraju?
Postoje tri široke kategorije koje pokrivaju većinu upita za pretraživanje: informacije, navigaciju i transakcije. Iako ova klasifikacija nije teoretski fiksirana, empirijski je potvrdio prisutnost stvarnih upita u tražilicama.
Zahtjevi za informacijama su oni koji pokrivaju široke teme (na primjer, određeni model grada ili kamiona) za koje se mogu dobiti tisuće relevantnih rezultata.
Navigacija - to su upiti koji traže jednu stranicu ili web stranicu na određenoj temi (na primjer, YouTube).
Transakcijski - odražavaju namjeru korisnika da izvrši određenu radnju, na primjer, kupi automobil ili knjigu ulazi.
Tražilice često podržavaju četvrtu vrstu upita, koja se upotrebljava mnogo rjeđe. To su tzv. Zahtjevi za povezivanjem koji sadrže izvješće o povezivanju indeksirane web-grafike (broj veza na određeni URL ili broj indeksiranih stranica s određene domene).
Kako se obavlja pronalaženje informacija?
Većina resursa za pretraživanje ne otkriva svoje dnevnike pretraživanja pa je vrlo teško pronaći informacije o tome što korisnici traže na webu. Ipak, prvo znanstveno istraživanje objavljeno je 1998. godine. Kasnije je u 2001. godini provedena anketa koja je analizirala upite koje su bile vrlo relevantne. Također je postalo jasno kako robota pretraživanja jezik upita.
Zanimljive karakteristike vezane uz pretraživanje weba postale su poznate:
Prosječna duljina upita za pretraživanje bila je 2,4 riječi.
- Oko polovice korisnika poslalo je jedan zahtjev, a nešto manje od trećine korisnika napravilo je tri ili više jedinstvenih upita jedan po jedan.
- Gotovo polovica korisnika pogledala je samo prvu jednu ili dvije stranice rezultata.
- Manje od 5% korisnika koristi napredne mogućnosti pretraživanja (na primjer, izbor određenih kategorija ili pretraživanje u pretraživanju).
Značajke prilagođenih radnji
Istraživanje je također pokazalo da 19% upita sadrži geografski naziv (na primjer, imena, poštanski brojevi, zemljopisni predmeti itd.). Vrijedno je napomenuti da su uz kratke upite (tj. S nekoliko uvjeta) često bile prisutne predvidljive sheme prema kojima su korisnici promijenili svoje izraze za pretraživanje.
Također je ustanovljeno da se 33% zahtjeva od jednog korisnika ponavlja, au 87% slučajeva korisnik će kliknuti na isti rezultat. To sugerira da mnogi korisnici koriste ponovljene zahtjeve za pregled ili ponovno pronalaženje informacija.
Distribucija upita frekvencije
Osim toga, stručnjaci su potvrdili da raspodjela učestalosti upita odgovara zakonu o moći. To znači da se mali dio ključnih riječi promatra u najvećem popisu zahtjeva (na primjer, više od 100 milijuna), a najčešće se koriste. Ostali izrazi u istim temama koriste se rjeđe i pojedinačno. Ovaj se fenomen zove Pareto princip (Ili „80-20 pravilo”), a moguće je koristiti takve tražilice optimizacija tehnike kao što su indeksiranje ili diobom baze podataka, caching i prethodno učitavanje, a također pruža priliku za poboljšanje jezik upita tražilice.
U posljednjih nekoliko godina, ona je pokazala da je prosječna dužina upit u stalnom je porastu tijekom vremena. Tako je prosječna zahtjev na engleskom postao duže. U tom smislu, Google je predstavio ažuriranja pod nazivom „Kolibri” (kolovoz 2013.), koja je u stanju nositi duge fraze pretraživanja bez protokola „govori” upitni jezik (poput „Gdje je najbliži kafić?”).
Za dulje upite upotrebljava se njihova obrada - podijeljeni su u fraze, formulirane u standardnom jeziku, a odgovori na različite dijelove prikazuju se zasebno.
Strukturirani upiti
Tražilice koje podržavaju logičke operacije i sintakse, upotrebljavajte više proširenih jezika upita. Korisnik koji pretražuje dokumente koji pokrivaju nekoliko tema ili lica može opisati svaku od njih po logičkoj karakterizaciji riječi. U jezgri, logični jezik upita zbirka je specifičnih fraza i interpunkcijskih oznaka.
Što je napredno pretraživanje?
Jezik upita "Yandex" i "Google" može izvršiti specifičniju pretragu, pod određenim uvjetima. Napredno pretraživanje može tražiti dio naziva stranice ili prefiksa zaglavlja, kao i određenih kategorija i popisa imena. Također može ograničiti pretraživanje stranica koje sadrže određene riječi u naslovu ili se nalaze u određenim skupinama tema. Korespondentno korištenje jezika upita može procesuirati parametre redoslijed veličine složenijim od površinskih rezultata većine tražilica, uključujući one koje korisnik daje riječima s promjenjivim završetkom i sličnim pravopisom. Kada prikazujete rezultate naprednog pretraživanja, prikazat će se veza na relevantne odjeljke stranice.
Također je moguće pretražiti sve stranice koje sadrže određenu fraza, a kod standardnog upita tražilice se ne mogu zaustaviti na bilo kojoj stranici rasprave. U mnogim slučajevima, jezik upita može dovesti do bilo koje stranice koja se nalazi u noindex oznakama.
U nekim slučajevima dobro oblikovani upit omogućuje vam pronalaženje informacija koje sadrže niz posebnih znakova i slova drugih pisma (kineski hijeroglifi na primjer).
Kako se čitaju likovi jezika upita?
Gornji i donji dio, kao i neke dijakritičke oznake (umlauti i naglasci) nisu uključeni u pretraživanje. Na primjer, traženje ključne riječi Citroen ne nalazi stranice koje sadrže riječ "Citroen". Ali neke ligature odgovaraju pojedinačnim slovima. Na primjer, traženje riječi "aeroskop" lako će pronaći stranice koje sadrže "Ereskebing" (AE = Æ).
Mnogi ne-alfanumeričkih znakova stalno ignoriraju. Na primjer, to je nemoguće naći podatke za upite koji sadrže niz | L | (Pismo između dvije okomite linije), unatoč činjenici da je ovaj simbol se koristi u nekim predlošcima pretvoriti. Rezultat svega će „LT” podataka. Neki simboli i fraze su obrađene na različite načine: upit „kredita (financije)” prikazuje članak s riječi „kredit” i „financije”, zanemarujući zagrade, čak i ako je članak s točnim nazivom „kredit (financije)”.
Postoje mnoge funkcije koje se mogu koristiti s jezikom upita.
sintaksa
Jezik upita "Yandex" i "Google" može upotrijebiti neke interpunkcijske znakove radi preciziranja pretraživanja. Na primjer, kovrčaste zagrade su {{search}}. Fraza koja se nalazi u njima će biti pretražena u cijelosti, bez promjena.
Izraz u dvostrukim navodnicima omogućuje određivanje objekta pretraživanja. Na primjer, citirana riječ bit će prepoznata kao figurativno ili kao izmišljeni lik, bez navodnika - kao informacija dokumentarne prirode.
Osim toga, sve glavne tražilice podržavaju znak ";" za logično "ne", kao i / ili. Izuzetak su pojmovi koji se ne mogu razdvojiti pomoću crtice ili prefiksa crtica.
Neodgovarajuća korespondencija fraze za pretraživanje označena je simbolom ~. Na primjer, ako se ne sjećate točnog teksta pojma ili naslova, možete je navesti u nizu za pretraživanje s navedenim znakom i moći ćete dobiti rezultate s najvećom sličnošću.
Parametri prilagođenog pretraživanja
Postoje i parametri pretraživanja kao što su intitle i incategory. Filtri su prikazani kroz debelo crijevo, u obliku "filtar: niz upita". Niz upita može sadržavati pojam ili izraz pretraživanja ili dio ili cijeli naziv stranice.
Funkcija "intitle: upit" daje prioritet rezultatima pretraživanja po imenu, ali također prikazuje uobičajene rezultate za sadržaj naslova. Nekoliko takvih filtera može se istovremeno koristiti. Kako iskoristiti ovu priliku?
Zahtjev za tip "intitle: airport name" iznijet će sve članke koji sadrže naslov zračne luke u naslovu. Ako ga formulirate kao "parking intitle: airport name", tada ćete u naslovu dobiti članke s imenom zračne luke i spomenuti parkiranje u tekstu.
Filtriranje pretraživanja "kategorija: kategorija" radi na principu početnog izdavanja članaka koji pripadaju određenoj grupi ili popisu stranica. Na primjer, upit za pretraživanje za vrstu "Hramovi bez kategorije: Povijest" proizvodi rezultate o povijesti hramova. Ova se funkcija može koristiti i kao proširena postavljanjem različitih parametara.
- Distribuirane baze podataka
- Baza podataka je složen sustav
- SQL datoteku. SQL format datoteke: opis proširenja
- MySQL je ono što i gdje se primjenjuje?
- Pregled sustava za upravljanje bazama podataka
- Kako sastaviti SQL upite - detaljni primjeri
- SQL `za teapots`: što trebate znati za početnike?
- Rad s bazom podataka: koji su zahtjevi za
- MySQL - što je to? Pogreška MySQL-a
- DB je ... Vrste i svojstva baze podataka
- MySQL - zahtjev u zahtjevu. MySQL: primjeri upita. Ugrađeni MySQL upiti
- SQL gdje: metode primjene i primjeri
- Što je SQL upit?
- SQL SUBSTRING funkcija
- Izrada upita u programu Access. Vrste zahtjeva
- Obriši izjavu Izbriši MySQL
- Kako stvoriti bazu podataka i što je SQL?
- Informacijski i informacijski procesi
- Struktura baze podataka
- Pristup rezultatima uzorka putem MySQL fetch polja
- Pojedinosti o povezivanju tablica za pristup