W wyszukiwaniu można używać terminów prostych, czyli pojedynczy wyrazów oraz fraz, czyli wyrażeń złożonych z kilku słów ujętych w cudzysłów np. "Uniwersytet Mikołaja Kopernika". W przypadku użycia cudzysłowu wyszukiwane będą tylko te dokumenty, które zawierają całą frazę.
Terminy wyszukiwawcze można łączyć za pomocą operatorów logicznych. Można też używać tzw. znaków maskujących, które zastępują dowolne litery i cyfry oraz ich ciągi, wyszukiwać terminy podobne, znajdujące się w pewnej odległości od siebie lub określać priorytet wyszukiwanych terminów.
Wyszukiwanie rozmyte (fuzzy search) znajduje zastosowanie w wypadku terminów prostych podobnych do siebie np. Copernicus, Copernikus, Kopernikus. Dokumenty zawierające te terminy można wyszukać dodając znak tyldy do terminu: copernicus~.
Stopień poszukiwanego podobieństwa, można określić współczynnikiem, który zmienia się w zakresie od 0 (brak podobieństwa) do 1 (terminy identyczne). Domyślnie współczynnik podobieństwa ustawiony jest na wartość 0.5. Aby ją zmienić, do wyszukiwanego terminu należy dodać znak tyldy wraz z wyraźnie określonym współczynnikiem, np. kopernik~0.4.
Możliwe jest również określenie w jakiej odległości ma się znajdować jednen z wyszukiwanych terminów od innego (tzw. proximity search). Jeśli np. pamiętamy, że dokumencie w niewielkiej odległości od siebie pojawiały się wyrażenia Choral-buch oraz Westpreussen, możemy użyć następującego zapytania: "Choral-buch Westpreussen"~6.
Można określić priorytet wyszukiwanego terminu przez dodanie znaku ^ wraz z liczbą (większą niż 1). Np. zapytanie stempowski^4 grydzewski zwróci dokumenty, w których występują oba nazwiska, ale na początku listy znajdą się te, w których częściej pojawia się nazwisko oznaczone wyższym priorytetem. Domyślny priorytet wyszukiwania wynosi 1.
Wyrażenia w zapytaniach złożonych można grupować za pomocą nawiasów. Zabieg taki pozwala nadać rozbudowanym zapytaniom zamierzony, jednoznaczny sens, podobnie jak to się dzieje w działaniach arytmetycznych.
Najpierw przetwarzane są wyrażenia cząstkowe wewnątrz nawiasów, a następnie większe całości. Zapytanie o kształcie: "De revolutionibus orbium coelestium" AND (Copernicus OR Kopernik) spowoduje wyszukanie dokumentów, w ktorych występuje tytuł dzieła Kopernika oraz jego nazwisko przynajmniej w jednej z dwóch form.
Ze zrozumiałych względów znaki służące do budowania zapytań złożonych (+ - && || ! ( ) { } [ ] ^ " ~ * ? : \) są traktowane podczas wyszukiwania inaczej niż pozostałe: pełnią rolę elementów składni zapytania, a nie cząstek wyszukiwanego wyrażenia. Aby objąć je procesem wyszukiwania należy umieścić przed nimi tzw. znak ucieczki \. Np. w celu wyszukania frazy "(2 + 2)*2" należy wpisać "\( 2 \+ 2 \) \* 2"
Pełny opis sposobu formułowania zapytań (strona w języku angielskim): Jakarta Lucene Query Parser Syntax.
Tekst oryginalnie zamieszczony na stronach Kujawsko-Pomorskiej Biblioteki Cyfrowej.
Ten utwór jest dostępny na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 2.5 Polska.
Jeleniogórskie Centrum Informacji
I Edukacji Regionalnej - Książnica Karkonoska
ul. Bankowa 27,
58-500 Jelenia Góra
tel. 75 75 259 57
Ta strona wykorzystuje pliki 'cookies'. Więcej informacji