2024 Kirjoittaja: Howard Calhoun | [email protected]. Viimeksi muokattu: 2023-12-17 10:26
Nykyajan ihmisen on vaikea kuvitella elämää ilman Internetiä ja lähes välitöntä pääsyä tietolähteisiin. Käyttäjä harvoin ajattelee, kuinka halutun sisällön haku verkossa suoritetaan. Mutta tämä on erittäin mielenkiintoista.
Tiedonhakujärjestelmä (IPS) on monimutkainen ohjelmisto- ja laitteistojärjestelmä, joka valitsee tiedot käyttäjän pyynnöstä. Tieto tallennetaan palvelimille digitaalisessa muodossa, kuten ennen kirjastojen hyllyillä oli kirjoja. Järjestelmä koostuu useista alajärjestelmistä. Jokainen suorittaa tehtävänsä käsittelemällä käyttäjän pyyntöä ja toimittamalla hänelle tietoa teksti- tai äänimuodossa. Ratkaistavien tehtävien moninaisuus määrää nykyaikaisten tiedonhakujärjestelmien (lyhenne tiedonhakujärjestelmästä) arkkitehtuurin monimutkaisuuden. Eräänlainen "musta laatikko": sisääntulossa - pyynnön teksti, sisällä oleva - on tuntematon, ulostulossa - kattava tieto.
Syötevirtaukset
Pyytää tietoja, jotka henkilö muodostaa tekstimuodossa pienoisohjelmansa näytölle,muodostavat pienen osan hakukoneen käsittelemistä pyynnöistä. Pääasialliset hakukyselyt muodostuvat roboteista, jotka hyväksyvät ihmisen pyynnön ja tekevät monivaiheisen haun ja palautteen käyttäjän kanssa. Tiedonhakujärjestelmiin kuuluvat tunnetut Google, Yandex ja muut, jotka käsittelevät miljoonia pyyntöjä päivittäin.
Lähdehakuobjektit
Haun kiinnostavia kohteita ovat asiakirjat, tietueet, videot, kuvat ja paljon muuta. Ne luodaan IPS:n ulkopuolella. Yleisessä tiedon tallennus- ja hakujärjestelmässä tulisi olla sisäänrakennettu bibliografinen järjestelmä - eräänlainen luettelo, jonka avulla voit etsiä kaikenlaisia kohteita.
Objekteista tai niiden digitaalisista muunnoksista tulee IPS:n "sisääntuloresurssit". Niiden joukosta valitaan käyttäjän tarvitsemat tiedot.
Ulkoiset lähteet
Tietojen valintanäkymässä käytetään ulkoisia tietolähteitä. Tämä on tieto, jota käyttäjä etsii. Elokuvan nimi, lainaus kirjasta ja paljon muuta. Tietokonehakua varten nämä tiedot on käännettävä kyselyksi algoritmisella kielellä. IPS:ssä tämä tehdään käyttämällä lohkoa kyselyjen luomiseen, indeksointiin ja kehittämiseen.
Ihannetapauksessa näiden kolmen prosessin – esitystavan, indeksoinnin ja kyselyn kehittämisen – pitäisi perustua identtisiin tietolähteisiin, mutta käytännössä tämä ei ole mahdollista.
Tietolähteitä tulee tarkistaa ja päivittää jatkuvasti, ja päivityksen tulee olla identtinen jasynkronoitu. Ja ulkoinen tietolähde edeltää aina kronologisesti sen käyttöä hakukoneissa kyselyyn, joskus useita vuosia.
Esitykset
Alkuperäisten objektien esitykset koostuvat syötetiedoista jossain yhdistelmässä tai muunnettu tietyn tiedonhakujärjestelmän sääntöjen ja algoritmien mukaisesti.
Näkymät ovat enemmän tai vähemmän muunnettuja kopioita alkuperäisestä hakuobjektista. Editoimattomien kokonaisten tekstien kokoelmassa jokainen teksti on oma esitysnsä. Museonäyttelyiden ja esineiden kokoelmassa esitys voi olla muunnettu kuvaus esineestä sen kuvalla. Joissain tapauksissa esitys voi olla johdettu osittain alkuperäisestä objektista ja osittain kuvauksesta: bibliografisissa hakukoneissa esitykset johdetaan kohteesta - esimerkiksi otsikko, tekijän nimi yhdistetään teoksen huomautukseen.
Haettavissa oleva hakemisto
Koska tiedonhakujärjestelmissä tiedot tallennetaan esityksen muodossa, on loogista olettaa, että haku suoritetaan esityksen mukaan ja valinnan jälkeen annetaan käyttäjälle. Käytännössä näin ei ole. Esimerkiksi nykyiset online-kirjastoluettelot rajoittavat tyypillisesti haut muutamaan kenttään: tekijä, otsikko ja tekstitykset näkymässä, joka sisältää muita kenttiä, joista ei tehdä hakuja. Tämä on riittävä syy erottaa toisistaannäkymä ja haettava hakemisto, joka on näkymän hakuosa. Se määrittelee kaiken, minkä pitäisi olla haettavissa. Haettavissa oleva hakemisto, kuten näkymä- ja lähdeobjekti, voidaan jakaa erillisiksi alahakemistoiksi tarkempien, kohdistettujen hakujen saamiseksi
Hakukoneilla on yleensä sisäinen synteettinen rakenne kelvollisten hakutulosten löytämiseksi. Tämä rakenne on haettavan indeksin toinen komponentti.
Prosedullisesti indeksointiprosessi voidaan toteuttaa eri tavoin: haettava hakemisto voidaan saada:
- kirjaimellisesti kopioidaan haettavissa oleva esitys;
- kopioimalla näkymän tiedot. Tämä voi olla osa tai kaikki näkymät, jotka ovat fyysisesti olemassa vain fragmentteina ja jotka on jaettu hakuindeksin luomista koskevien sääntöjen mukaisesti ja jotka kerätään tarvittaessa.
Pyynnön suunnittelusäännöt ja muodolliset pyynnöt
Kyselyn suunnittelu on funktio, joka välittää käyttäjän kyselyn ja muodollisen kyselyn. Se muuttaa käyttäjän kyselyn ja sovittaa sen hakukomentosanastojen, indeksimäärittelyn ja indeksin kanssa ennen hakua. IPS:n kehityksen kynnyksellä tämä rooli on perinteisesti osoitettu päteville IT-asiantuntijoille.
Tietokonekyselyjen kehittäminen, jotka voivat sovittaa sanakirjakyselyt haettavaan hakemistojärjestelmään, kutsutaan yleisesti "sanakirjasyöte"-moduuliksi. Tämän toiminnon automatisointi on lupaavaa ja tarjoaa mahdollisuuksia asiantunteville ja todennäköisyyspohjaisille hakumenetelmille.
Muodallisesta pyynnöstä tulee virallinen pyyntö sen jälkeen, kun käyttäjän pyyntö on muunnettu. Esimerkkejä tällaisista muodollisista muunnoksista ovat katkaisu, korvaaminen, normalisointi, vektorointi ja muut "ulkoisen" esityksen muunnokset tietokoneen IPS:n "sisäisiksi" esityksiksi (salauksen purku - tiedonhakujärjestelmä).
Poimitut asiakirjalinkkijoukot
Tuloksena oleva tietolähteiden joukko on loogisesti haettavan indeksin muodolliseen kyselyyn soveltamien täsmäyssääntöjen luomien näkymien osajoukko.
Yleensä, mutta ei välttämättä, palautetuille tiedoille on erillinen lajitteluprosessi. Verkkokirjastojen luettelot järjestävät vastaanotetut joukot yleensä uudelleen aakkosjärjestyksessä tekijän mukaan ennen näyttämistä. Tiedonhakujärjestelmissä, jotka tuottavat tiukkoja sijoituksia, sijoitusjärjestys edeltää uudelleenjärjestystä.
Tulosteet
Hakutulosten ulostulo tapahtuu perinteisesti näytöllä, useammin muualla käytettävänä tai johonkin muuhun tarkoitukseen tarkoitettujen objektivirtojen muodossa, täydentää päähakusilmukan. Tällaisia virtoja voidaan lähettää visualisointilaitteisiin, tallennus jatkokäsittelyä varten tai käyttää syöttövirroina muihin valintapalveluihin.
Tiedonhakujärjestelmät sallivat palautettaminkä tahansa valintaprosessin tulos. Minkä tahansa prosessin tulos voi olla palautetta muille prosesseille. Palaute voi olla perustana asiantuntija-arviolle missä tahansa vaiheessa.
Suositeltava:
Mitä lannoitteet ovat: tyypit, luokitus, koostumukset, tarkoitus
Puutarhanhoito on maanmiestemme keskuudessa erittäin suosittua. Jotta voit kasvattaa vihanneksia, hedelmiä tai koristekasveja menestyksekkäästi, sinun on ymmärrettävä niiden hoidon perusteet. On erittäin tärkeää ensin tutkia, mitä lannoitteet ovat. Näin voit valita oikein tarvittavat pintasidokset ja levittää ne ajoissa
Johtamisen tarkoitus on Johtamisen rakenne, tehtävät, toiminnot ja periaatteet
Jopa johtamisesta kaukana oleva ihminen tietää, että johtamisen tarkoitus on tuottaa tuloja. Raha on se mikä takaa edistymisen. Tietenkin monet yrittäjät yrittävät kalkkia itsensä ja peittävät siksi voitonhimonsa hyvillä aikomuksilla. Onko näin? Selvitetään se
Vakuutuksen määritelmä, toiminnot, ominaisuudet ja tarkoitus
Aloita tämä artikkeli määrittämällä, mitä vakuutus on. Tämä termi tarkoittaa tietyntyyppistä taloudellista suhdetta, joka tarjoaa vakuutussuojan organisaatioille tai henkilöille erilaisilta vaaroilta. Tässä artikkelissa käsitellään vakuutuksen toimintoja, sen tavoitteita ja tyyppejä
Turvajärjestelmä: tarkoitus, toiminnot ja tekniset vaatimukset
Rajoitusjärjestelmällä on erittäin tärkeitä toimintoja. Hän kiinnittää ihmisen korkeuteen sekä ajoneuvoihin. Sen toiminnassa on useita hienouksia, jotka on otettava huomioon, jotta se olisi tehokas
Pakkauksen luokittelu pakkauspaikalla: tyypit, tarkoitus, toiminnot ja ominaisuudet, pakkauksen perusvaatimukset
Nykyään on tapana luokitella pakkaukset useiden ominaisuuksien mukaan. Niistä pakkauspaikka; valmistuksessa käytetyt materiaalit; lomake; käyttötiheys; kontin tarkoitus; mitat ja kantavuus. Tässä artikkelissa tarkastelemme pakkaustyyppejä, luokitusta ja kunkin niistä ominaisuuksia