IPS je Účel a funkce systémů pro vyhledávání informací
IPS je Účel a funkce systémů pro vyhledávání informací

Video: IPS je Účel a funkce systémů pro vyhledávání informací

Video: IPS je Účel a funkce systémů pro vyhledávání informací
Video: Что нужно, чтобы сделать модель электровоза ЧС2? RTM 1:87 2024, Duben
Anonim

Pro moderního člověka je těžké si představit život bez internetu a téměř okamžitého přístupu ke zdrojům informací. Uživatel jen zřídka přemýšlí o tom, jak probíhá vyhledávání požadovaného obsahu v síti. Ale tohle je velmi zajímavé.

Systém vyhledávání informací (IPS) je komplexní softwarový a hardwarový systém, který vybírá informace na žádost uživatele. Informace jsou na serverech ukládány v digitální podobě, jako bývaly knihy na policích knihoven. Systém se skládá z mnoha subsystémů. Každý plní svůj úkol v procesu zpracování požadavku uživatele a poskytování informací v textové nebo zvukové podobě. Množství úkolů, které je třeba řešit, určuje složitost architektury moderních systémů vyhledávání informací (zkratka systému vyhledávání informací). Jakási "černá skříňka": na vstupu - text požadavku, co je uvnitř - není známo, na výstupu - komplexní informace.

Kartotéka v reálném životě
Kartotéka v reálném životě

Vstupní streamy

Žádosti o informace, které osoba tvoří v textové podobě na obrazovce svého gadgetu,tvoří malou část požadavků zpracovaných vyhledávačem. Hlavní pole vyhledávacích dotazů tvoří roboti, kteří přijímají lidskou žádost a provádějí vícekrokové vyhledávání a zpětnou vazbu s uživatelem. Systémy pro získávání informací zahrnují známý Google, Yandex a další, které denně zpracovávají miliony požadavků.

Objekty vyhledávání zdrojů

Sada počátečních objektů zájmu pro vyhledávání jsou dokumenty, záznamy, videa, obrázky a další. Jsou vytvořeny mimo IPS. Obecný systém ukládání a vyhledávání informací by měl mít vestavěný bibliografický systém – druh katalogu, který vám umožní vyhledávat jakýkoli druh objektů.

Objekty nebo jejich digitální transformace se stávají „vstupním zdrojem“do IPS. Právě mezi nimi jsou vybrány informace, které uživatel potřebuje.

Hledejte informace
Hledejte informace

Externí zdroje

Zobrazení výběru informací využívá externí zdroje znalostí. Toto jsou informace, které uživatel hledá. Název filmu, citát z knihy a další. Pro počítačové vyhledávání musí být tyto informace přeloženy do dotazu v algoritmickém jazyce. V IPS se to provádí pomocí bloku pro vytváření, indexování a vývoj dotazů.

V ideálním případě by se tyto tři procesy – reprezentace, indexování a vývoj dotazů – měly spoléhat na identické zdroje znalostí, ale v praxi to není dosažitelné.

Zdroje znalostí by měly být neustále kontrolovány a aktualizovány a aktualizace by měla být totožná asynchronizované. A externí zdroj znalostí vždy chronologicky předchází jeho použití ve vyhledávačích na dotaz, někdy i o několik let.

Systém vyhledávání informací
Systém vyhledávání informací

Výkony

Reprezentace původních objektů jsou tvořeny vstupními daty v nějaké kombinaci nebo transformovanými v souladu s pravidly a algoritmy konkrétního systému vyhledávání informací.

Pohledy jsou více či méně transformované kopie původního hledaného objektu. Ve sbírce neupravených plných textů je každý text svým vlastním zobrazením. Ve sbírce předmětů muzejních exponátů a artefaktů může být zobrazením transformovaný popis předmětu s jeho vyobrazením. V některých případech může být zobrazení částečně odvozeno od původního objektu a částečně od popisu: v bibliografických vyhledávačích jsou zobrazení odvozena od objektu - například název, jméno autora bude spojeno s anotací díla.

Nalezení toho, co potřebujete
Nalezení toho, co potřebujete

Prohledávatelný index

Vzhledem k tomu, že informace v systémech pro vyhledávání informací jsou uloženy ve formě reprezentace, je logické předpokládat, že vyhledávání je prováděno podle reprezentace a po výběru je předáno uživateli. V praxi tomu tak není. Například aktuální katalogy online knihoven obvykle omezují vyhledávání na několik polí: autora, název a titulky v pohledu, který obsahuje další pole, která se neprohledávají. To je dostatečný důvod, proč je nutné rozlišovatpohled a prohledávatelný index, což je vyhledávací část pohledu. Definuje vše, co by mělo být prohledávatelné. Prohledávatelný index, jako je zobrazení a zdrojový objekt, lze rozdělit do samostatných dílčích indexů a poskytovat přesnější a cílené vyhledávání

Vyhledávače obvykle mají interně syntetickou strukturu pro shodu platných výsledků vyhledávání. Tato struktura je druhou součástí prohledávatelného indexu.

Procedurálně lze proces indexování implementovat různými způsoby: prohledávatelný index lze získat:

  • doslova kopírování prohledávatelné reprezentace;
  • zkopírováním podrobností zobrazení. Může se jednat o část nebo všechny pohledy, které fyzicky existují pouze jako fragmenty, distribuované podle pravidel pro vytváření indexu pro vyhledávání, který bude v případě potřeby shromažďován.
Správa vyhledávání
Správa vyhledávání

Pravidla návrhu požadavků a formální požadavky

Dotazové inženýrství je funkce, která zprostředkovává mezi uživatelským dotazem a formálním dotazem. Transformuje dotaz uživatele a před načtením jej porovnává se slovníky příkazů načítání, specifikací indexu a indexem. Na úsvitu vývoje IPS byla tato role tradičně přidělena kvalifikovaným IT specialistům.

Vývoj počítačových dotazů, které mohou odpovídat slovníkovým dotazům do prohledávatelného indexového systému, se běžně nazývá modul „vstupu do slovníku“. Automatizace této funkce je slibná a nabízí příležitosti pro expertní a pravděpodobnostní vyhledávací metody.

Formální žádost se stane formální žádostí poté, co byla žádost uživatele převedena. Příklady takových formálních transformací zahrnují zkrácení, substituci, normalizaci, vektorizaci a další transformace „vnější“reprezentace na „interní“reprezentace počítačového IPS (dešifrování – systém získávání informací).

Sada odkazů na extrahovaný dokument

Výsledná sada informačních zdrojů je logicky podmnožinou pohledů vytvořených srovnávacími pravidly aplikovanými na formální dotaz pomocí prohledávatelného indexu.

Obvykle, ale ne nutně, existuje samostatný proces třídění obnovené sady informací. Katalogy online knihoven obvykle před zobrazením mění pořadí přijatých sad abecedně podle autora. V systémech vyhledávání informací, které vytvářejí přísná hodnocení, pořadí pořadí předchází jakékoli změně pořadí.

Analýza dat
Analýza dat

Výstupní streamy

Výstup výsledků vyhledávání se provádí tradičně na displeji, častěji ve formě toku objektů, které lze použít jinde nebo pro jiný účel, doplňuje hlavní smyčku vyhledávání. Takové toky lze odesílat do vizualizačních zařízení, úložiště pro další zpracování nebo použití jako vstupní toky do jiných výběrových služeb.

Systémy pro vyhledávání informací umožňují zpětnou vazbu odvýstup jakéhokoli výběrového řízení. Výstupem jakéhokoli procesu může být zpětná vazba k dalším procesům. Zpětná vazba může poskytnout základ pro odborný úsudek v jakékoli fázi.

Doporučuje: