IPS on Tiedonhakujärjestelmien tarkoitus ja toiminnot
IPS on Tiedonhakujärjestelmien tarkoitus ja toiminnot

Video: IPS on Tiedonhakujärjestelmien tarkoitus ja toiminnot

Video: IPS on Tiedonhakujärjestelmien tarkoitus ja toiminnot
Video: Meteor Strikes Russia, Over 1,000 Believed Injured 2024, Marraskuu
Anonim

Nykyajan ihmisen on vaikea kuvitella elämää ilman Internetiä ja lähes välitöntä pääsyä tietolähteisiin. Käyttäjä harvoin ajattelee, kuinka halutun sisällön haku verkossa suoritetaan. Mutta tämä on erittäin mielenkiintoista.

Tiedonhakujärjestelmä (IPS) on monimutkainen ohjelmisto- ja laitteistojärjestelmä, joka valitsee tiedot käyttäjän pyynnöstä. Tieto tallennetaan palvelimille digitaalisessa muodossa, kuten ennen kirjastojen hyllyillä oli kirjoja. Järjestelmä koostuu useista alajärjestelmistä. Jokainen suorittaa tehtävänsä käsittelemällä käyttäjän pyyntöä ja toimittamalla hänelle tietoa teksti- tai äänimuodossa. Ratkaistavien tehtävien moninaisuus määrää nykyaikaisten tiedonhakujärjestelmien (lyhenne tiedonhakujärjestelmästä) arkkitehtuurin monimutkaisuuden. Eräänlainen "musta laatikko": sisääntulossa - pyynnön teksti, sisällä oleva - on tuntematon, ulostulossa - kattava tieto.

Korttitiedosto tosielämässä
Korttitiedosto tosielämässä

Syötevirtaukset

Pyytää tietoja, jotka henkilö muodostaa tekstimuodossa pienoisohjelmansa näytölle,muodostavat pienen osan hakukoneen käsittelemistä pyynnöistä. Pääasialliset hakukyselyt muodostuvat roboteista, jotka hyväksyvät ihmisen pyynnön ja tekevät monivaiheisen haun ja palautteen käyttäjän kanssa. Tiedonhakujärjestelmiin kuuluvat tunnetut Google, Yandex ja muut, jotka käsittelevät miljoonia pyyntöjä päivittäin.

Lähdehakuobjektit

Haun kiinnostavia kohteita ovat asiakirjat, tietueet, videot, kuvat ja paljon muuta. Ne luodaan IPS:n ulkopuolella. Yleisessä tiedon tallennus- ja hakujärjestelmässä tulisi olla sisäänrakennettu bibliografinen järjestelmä - eräänlainen luettelo, jonka avulla voit etsiä kaikenlaisia kohteita.

Objekteista tai niiden digitaalisista muunnoksista tulee IPS:n "sisääntuloresurssit". Niiden joukosta valitaan käyttäjän tarvitsemat tiedot.

Etsi tietoa
Etsi tietoa

Ulkoiset lähteet

Tietojen valintanäkymässä käytetään ulkoisia tietolähteitä. Tämä on tieto, jota käyttäjä etsii. Elokuvan nimi, lainaus kirjasta ja paljon muuta. Tietokonehakua varten nämä tiedot on käännettävä kyselyksi algoritmisella kielellä. IPS:ssä tämä tehdään käyttämällä lohkoa kyselyjen luomiseen, indeksointiin ja kehittämiseen.

Ihannetapauksessa näiden kolmen prosessin – esitystavan, indeksoinnin ja kyselyn kehittämisen – pitäisi perustua identtisiin tietolähteisiin, mutta käytännössä tämä ei ole mahdollista.

Tietolähteitä tulee tarkistaa ja päivittää jatkuvasti, ja päivityksen tulee olla identtinen jasynkronoitu. Ja ulkoinen tietolähde edeltää aina kronologisesti sen käyttöä hakukoneissa kyselyyn, joskus useita vuosia.

Tiedonhakujärjestelmä
Tiedonhakujärjestelmä

Esitykset

Alkuperäisten objektien esitykset koostuvat syötetiedoista jossain yhdistelmässä tai muunnettu tietyn tiedonhakujärjestelmän sääntöjen ja algoritmien mukaisesti.

Näkymät ovat enemmän tai vähemmän muunnettuja kopioita alkuperäisestä hakuobjektista. Editoimattomien kokonaisten tekstien kokoelmassa jokainen teksti on oma esitysnsä. Museonäyttelyiden ja esineiden kokoelmassa esitys voi olla muunnettu kuvaus esineestä sen kuvalla. Joissain tapauksissa esitys voi olla johdettu osittain alkuperäisestä objektista ja osittain kuvauksesta: bibliografisissa hakukoneissa esitykset johdetaan kohteesta - esimerkiksi otsikko, tekijän nimi yhdistetään teoksen huomautukseen.

Löytää mitä tarvitset
Löytää mitä tarvitset

Haettavissa oleva hakemisto

Koska tiedonhakujärjestelmissä tiedot tallennetaan esityksen muodossa, on loogista olettaa, että haku suoritetaan esityksen mukaan ja valinnan jälkeen annetaan käyttäjälle. Käytännössä näin ei ole. Esimerkiksi nykyiset online-kirjastoluettelot rajoittavat tyypillisesti haut muutamaan kenttään: tekijä, otsikko ja tekstitykset näkymässä, joka sisältää muita kenttiä, joista ei tehdä hakuja. Tämä on riittävä syy erottaa toisistaannäkymä ja haettava hakemisto, joka on näkymän hakuosa. Se määrittelee kaiken, minkä pitäisi olla haettavissa. Haettavissa oleva hakemisto, kuten näkymä- ja lähdeobjekti, voidaan jakaa erillisiksi alahakemistoiksi tarkempien, kohdistettujen hakujen saamiseksi

Hakukoneilla on yleensä sisäinen synteettinen rakenne kelvollisten hakutulosten löytämiseksi. Tämä rakenne on haettavan indeksin toinen komponentti.

Prosedullisesti indeksointiprosessi voidaan toteuttaa eri tavoin: haettava hakemisto voidaan saada:

  • kirjaimellisesti kopioidaan haettavissa oleva esitys;
  • kopioimalla näkymän tiedot. Tämä voi olla osa tai kaikki näkymät, jotka ovat fyysisesti olemassa vain fragmentteina ja jotka on jaettu hakuindeksin luomista koskevien sääntöjen mukaisesti ja jotka kerätään tarvittaessa.
Haun hallinta
Haun hallinta

Pyynnön suunnittelusäännöt ja muodolliset pyynnöt

Kyselyn suunnittelu on funktio, joka välittää käyttäjän kyselyn ja muodollisen kyselyn. Se muuttaa käyttäjän kyselyn ja sovittaa sen hakukomentosanastojen, indeksimäärittelyn ja indeksin kanssa ennen hakua. IPS:n kehityksen kynnyksellä tämä rooli on perinteisesti osoitettu päteville IT-asiantuntijoille.

Tietokonekyselyjen kehittäminen, jotka voivat sovittaa sanakirjakyselyt haettavaan hakemistojärjestelmään, kutsutaan yleisesti "sanakirjasyöte"-moduuliksi. Tämän toiminnon automatisointi on lupaavaa ja tarjoaa mahdollisuuksia asiantunteville ja todennäköisyyspohjaisille hakumenetelmille.

Muodallisesta pyynnöstä tulee virallinen pyyntö sen jälkeen, kun käyttäjän pyyntö on muunnettu. Esimerkkejä tällaisista muodollisista muunnoksista ovat katkaisu, korvaaminen, normalisointi, vektorointi ja muut "ulkoisen" esityksen muunnokset tietokoneen IPS:n "sisäisiksi" esityksiksi (salauksen purku - tiedonhakujärjestelmä).

Poimitut asiakirjalinkkijoukot

Tuloksena oleva tietolähteiden joukko on loogisesti haettavan indeksin muodolliseen kyselyyn soveltamien täsmäyssääntöjen luomien näkymien osajoukko.

Yleensä, mutta ei välttämättä, palautetuille tiedoille on erillinen lajitteluprosessi. Verkkokirjastojen luettelot järjestävät vastaanotetut joukot yleensä uudelleen aakkosjärjestyksessä tekijän mukaan ennen näyttämistä. Tiedonhakujärjestelmissä, jotka tuottavat tiukkoja sijoituksia, sijoitusjärjestys edeltää uudelleenjärjestystä.

Tietojen analysointi
Tietojen analysointi

Tulosteet

Hakutulosten ulostulo tapahtuu perinteisesti näytöllä, useammin muualla käytettävänä tai johonkin muuhun tarkoitukseen tarkoitettujen objektivirtojen muodossa, täydentää päähakusilmukan. Tällaisia virtoja voidaan lähettää visualisointilaitteisiin, tallennus jatkokäsittelyä varten tai käyttää syöttövirroina muihin valintapalveluihin.

Tiedonhakujärjestelmät sallivat palautettaminkä tahansa valintaprosessin tulos. Minkä tahansa prosessin tulos voi olla palautetta muille prosesseille. Palaute voi olla perustana asiantuntija-arviolle missä tahansa vaiheessa.

Suositeltava: