Spisu treści:
Definicja - Co oznacza Apache Lucene?
Apache Lucene to projekt typu open source dla wysokowydajnej iw pełni funkcjonalnej biblioteki wyszukiwarek tekstowych, napisanej w całości przy użyciu języka Java.
Jest zdolny do wyszukiwania pełnotekstowego w dokumentach, dlatego jest to technologia odpowiednia dla każdej aplikacji wymagającej tej funkcji, szczególnie jeśli jest to platforma wieloplatformowa.
Po raz pierwszy został opracowany przez Douga Cuttinga w 1999 r. I we wrześniu 2001 r. Stał się oficjalnie częścią rodziny otwartych programów Java Open Source Fundacji Apache Foundation. Został zaktualizowany do projektu Apache najwyższego poziomu w lutym 2005 r.
Techopedia wyjaśnia Apache Lucene
Apache Lucene to wysokowydajna wyszukiwarka z koncepcją „dokumentu zawierającego pola tekstu” w swojej podstawowej logicznej architekturze. Zapewnia to dużą elastyczność i pozwala interfejsowi API Lucene uniezależnić się od dowolnego formatu pliku.
Każdy tekst z formatów takich jak MS Word, HTML, XML, PDF i OpenDocument może być indeksowany, dopóki można wyodrębnić informacje tekstowe, co oznacza, że nie może nic zrobić z obrazami.
Lucene nadaje się do każdej aplikacji, która wymaga pełnego indeksowania tekstu i możliwości wyszukiwania, ale jest powszechnie uznawana za doskonałe narzędzie do wdrażania wyszukiwarek internetowych i do lokalnego wyszukiwania pojedynczej witryny.
Dodatki zawarte:
- Skalowalne i wydajne indeksowanie - może przetwarzać ponad 150 Gb na godzinę na nowoczesnym sprzęcie i wymaga tylko 1 Mb na stertę pamięci.
- Wydajne, dokładne i wydajne algorytmy wyszukiwania - oferuje wiele rodzajów silnych zapytań, takich jak zapytania do wyrażeń, symboli wieloznacznych, bliskości i zasięgów. Posiada również wyszukiwanie według pól i sortowanie według dowolnego pola.
- Wiele platform - czysta implementacja Java, dostępna również w innych językach programowania.