Menu
Jest wolny
Zameldować się
główny  /  Internet / Jak przeprowadzane jest poszukiwanie zawodowe. Oprogramowanie i usługi do profesjonalnego wyszukiwania

Jak przeprowadzane jest profesjonalne wyszukiwanie. Oprogramowanie i usługi do profesjonalnego wyszukiwania

Czasami bardzo trudno jest znaleźć potrzebne i istotne informacje w Internecie. Ilość śmieci informacyjnych w sieci rośnie jak kula śnieżna, a czasami po prostu niemożliwe jest dotarcie do danych, których naprawdę potrzebujesz, za pomocą tradycyjnych Yandex i Google. Książka, którą trzymasz w rękach, wielokrotnie zwiększy skuteczność wyszukiwania informacji w Internecie. Oto techniki, witryny wyszukiwania i programy dla wyszukiwanie specjalistyczne Informacja. Rozważane są współczesne rodzaje wyszukiwań internetowych: wyszukiwanie uniwersalne, wyszukiwanie wertykalne, wyszukiwarki meta, budowa wyszukiwarek osobistych, wyszukiwanie treści audiowizualnych, wyszukiwanie w ukrytym Internecie. Dla wszystkich rozważanych systemów podano ich właściwości i wskazówki dotyczące najbardziej efektywnego użytkowania.

Wprowadzenie

Wyszukiwanie w Internecie jest ważnym elementem sieci. Mało kto zna dokładną liczbę zasobów sieciowych w nowoczesnym Internecie. W każdym razie rachunek idzie w miliardy. Aby móc wykorzystać potrzebne w danym momencie informacje, bez względu na to czy w celach biznesowych czy rozrywkowych, trzeba je najpierw odnaleźć w tym nieustannie uzupełnianym oceanie zasobów. Nie jest to wcale łatwe zadanie, ponieważ informacje we współczesnej sieci WWW nie są uporządkowane, co stwarza problemy z ich odnalezieniem. To nie przypadek, że wyszukiwarki internetowe stały się swego rodzaju „oknami” prowadzącymi do tej przestrzeni informacyjnej.

Mało jest internautów, którzy nigdy nie korzystali z dużych, uniwersalnych wyszukiwarek. Nazwy Google, Yandex i kilka innych dużych maszyn są na ustach wszystkich. Robią świetną robotę codzienne zadania Wyszukiwarka internetowa, a często użytkownicy nawet nie próbują szukać zamiennika. Jednocześnie liczba wyszukiwarek internetowych jest obecnie w tysiącach. Przyczyny tej różnorodności alternatywnych maszyn mają różne korzenie. Niektóre projekty starają się bezpośrednio konkurować z liderami światowego rynku poprzez staranną pracę z krajowymi zasobami internetowymi. Inne oferują funkcje zapytań, których nie ma w znanych wyszukiwarkach. Znaczna liczba alternatywnych maszyn specjalizuje się w wyszukiwaniu określonego obszaru tematycznego lub określonego rodzaju treści, osiągając imponujące wyniki w rozwiązywaniu tych problemów. Tak czy inaczej, włączenie takich wyszukiwarek do arsenału narzędzi wyszukiwania internetowego użytkownika może znacznie poprawić jego jakość. Tutaj jednak jest jeden niuans: trzeba wiedzieć o takich maszynach i umieć wykorzystać ich możliwości.

Zakładamy, że czytelnicy tej książki już dość dobrze znają technikę wyszukiwania za pomocą uniwersalnych wyszukiwarek. Tak dobrze, że poczuli ograniczenia związane z ich używaniem. Najprawdopodobniej takie osoby już próbowały wyszukiwać i używać pewnych dodatkowych narzędzi. Słowo drukowane nie pomija tematu wyszukiwania w Internecie: cyklicznie pojawiają się zarówno artykuły, jak i publikowane są książki. Ale ich bohaterowie są z reguły tacy sami - kilka wiodących uniwersalnych wyszukiwarek. Nasza książka różni się tym, że stara się objąć całe spektrum nowoczesnych rozwiązań wyszukiwania. Tutaj znajdziesz opisy i zalecenia dotyczące korzystania z najlepszych nowoczesnych usług ukierunkowanych na rozwiązywanie najczęstszych problemów wyszukiwania. Ta książka jest przeznaczona dla osób, które dużo pracują w Internecie i używają sieci, aby znaleźć potrzebne informacje - czy to w biznesie, na studiach, czy w hobby.

Aby wyszukiwanie w Internecie zakończyło się sukcesem, muszą być spełnione dwa warunki: zapytania muszą być dobrze sformułowane i należy je zadawać w odpowiednich miejscach. Innymi słowy, od użytkownika wymagana jest z jednej strony umiejętność tłumaczenia zainteresowań wyszukiwania na język wyszukiwanego hasła, az drugiej dobra znajomość wyszukiwarek, dostępnych narzędzi wyszukiwania, ich zalet i wad , co pozwoli na wybór w każdym szczególny przypadek najbardziej odpowiednie narzędzia wyszukiwania.

Obecnie nie ma jednego zasobu, który spełniałby wszystkie wymagania wyszukiwania w Internecie. Dlatego poważne podejście do wyszukiwania nieuchronnie wymaga użycia różnych narzędzi, używając każdego w najbardziej odpowiednim przypadku.

Rozdział 1

Uniwersalne wyszukiwarki internetowe

Wyszukiwarki internetowe ogólnego przeznaczenia są głównym i najbardziej znanym sposobem wyszukiwania w Internecie. Takie wyszukiwarki zapewniają maksymalne pokrycie różnych zasobów. Największe i najpopularniejsze wyszukiwarki należą do typu uniwersalnego. Są to naprawdę potężne rozwiązania z wieloma funkcjami i narzędziami, o których wielu użytkowników często nie wie. Zrozumienie cech i możliwości wyszukiwania uniwersalnego pozwala poznać mocne i słabe strony takich systemów oraz świadomie wybrać najskuteczniejsze narzędzia wyszukiwania.

Rynek uniwersalnych wyszukiwarek jest wystarczająco duży. W tym rozdziale rozważymy tylko najpotężniejsze maszyny, które są w stanie odpowiednio obsługiwać zapytania w języku rosyjskim. Rozdział otwiera historie o liderach rosyjskiej wyszukiwarki - Google.ru i Yandex. O każdej z tych wyszukiwarek napisano książki i wiele artykułów. Skoncentrujemy się na głównych cechach, które mają znaczenie dla użytkownika końcowego, a także spróbujemy zidentyfikować ich mocne strony.

Towarzyszy im nowa wyszukiwarka opracowana przez Microsoft Corporation - system Bing, wciąż zauważalnie pozbawiony uwagi, a także użyteczna i dość potężna wyszukiwarka Exalead, której zaletą jest dobre wsparcie szukaj w europejskich zasobach internetowych. Ten system jest nadal rzadkim gościem w arsenale wyszukiwania naszych użytkowników, więc jest rozważany bardziej szczegółowo niż inne.

W tym rozdziale, przeglądając systemy Google i Yandex, skupimy się tylko na możliwościach wyszukiwania w sieci, a wyszukiwanie w wyspecjalizowanych bazach danych tych projektów jest omówione w kolejnych rozdziałach dotyczących wyszukiwania obrazów i wideo. W przypadku innych wyszukiwarek uniwersalnych informacje o wyszukiwaniu multimediów podawane są natychmiast po ich zapoznaniu się.

Ponieważ trzy z czterech postaci w tym rozdziale są obcego pochodzenia, od razu zauważamy, że analizujemy możliwości tylko ich rosyjskich wersji. Faktem jest, że niektóre funkcje systemów zagranicznych, zwłaszcza eksperymentalnych, są często dostępne tylko w oryginalnych, zwykle anglojęzycznych wersjach usług.

Google

Wyszukiwarka Google jest zasłużenie uznawana za światowego lidera w zakresie nowoczesnych wyszukiwarek internetowych. Założona w 1998 roku firma Google do dziś pozostaje jednym z wiodących twórców trendów w wyszukiwaniu i usługach internetowych.

Programiści Google zawsze wyróżniali się większą dbałością o ulepszanie algorytmów wyszukiwarek, a także rozsądnym konserwatyzmem w zakresie interfejsu użytkownika. Umiejętność komponowania zapytania w Google można nazwać klasyczną, a sposób wyświetlania wyników wyszukiwania również stał się swego rodzaju standardem. W ostatnim czasie programiści Google dokonali poważnych zmian w tych obszarach - największa wyszukiwarka stała się zbyt staromodna, aby patrzeć na tło młodych konkurentów.

Google posiada jedną z największych baz indeksowych na świecie, która zapewnia szeroki zakres źródeł informacji. Informacje z indeksu Google są kompilowane w kilku pionowych podstawach. Oprócz najbardziej znanej bazy danych „Sieć” istnieje kilka multimedialnych baz danych („Zdjęcia”, „Wideo”), współpracujących ze źródłami aktualnych informacji i komunikatów w kanałach RSS, baza „Wiadomości”, a także baza danych „Blogs” indeksująca sieciowe pamiętniki. Dodatkowo Google oferuje szeroki wachlarz dodatkowych zasobów, wśród których warto zwrócić uwagę na usługę mapową, katalog witryn, usługę pytań i odpowiedzi. Te zasoby można również traktować jako narzędzia wyszukiwania.

W bazie danych „Sieć” Google oferuje proste i zaawansowane tryby wyszukiwania umożliwiające tworzenie zapytań. W trybie wyszukiwania prostego w dodatkowych narzędziach dostępna jest tylko klawiatura wirtualna. Zaawansowane wyszukiwanie oferuje więcej opcji. Ponieważ formularz wyszukiwania zaawansowanego jest dostępny w prawie wszystkich produktach wyszukiwania Google, rozważmy go bardziej szczegółowo (rys. 1.1).

Yandex

Oficjalnie zaprezentowana szerokiej publiczności w 1997 roku, wyszukiwarka Yandex rozwinęła się pomyślnie, a dziesięć lat później po raz pierwszy znalazła się wśród dziesięciu największych wyszukiwarek na świecie. W rosyjskim segmencie internetu osiągnął pozycję lidera, której nie zamierza na razie utracić pomimo rosnącej konkurencji. Od początku swojego istnienia Yandex wyróżnia się własnymi oryginalnymi algorytmami określania trafności wyników wyszukiwania, elastycznymi narzędziami do pracy z tekstem zapytań oraz uwzględnianiem specyfiki morfologii języka rosyjskiego podczas ich przetwarzania.

Yandex polega na własnych bazach danych indeksów. Oprócz przeszukiwania dokumentów internetowych system oferuje duży wybór specjalistycznych zasobów i usług dodatkowych. Yandex obecnie pracuje z obrazami, filmami, wiadomościami, blogami i słownikami. Potężne możliwości wyszukiwania są również zawarte we własnej usłudze mapowej oraz w systemie wyszukiwania produktów. Ponadto Yandex prowadzi własny katalog stron internetowych. Mocną stroną Yandex jest dobrze opracowany program wyszukiwanie lokalne, co jest szczególnie ważne dla naszych użytkowników. Yandex zapewnia programistom zewnętrznym możliwość dostępu do swoich baz danych. W rezultacie wiele rosyjskich projektów alternatywnych wyszukiwarek internetowych w taki czy inny sposób wykorzystuje zasoby Yandex. Oprócz system konwencjonalny wyszukiwarka oferuje również skróconą wersję Yandex, dostępną na ya.ru. Interfejs tej wersji składa się tylko z pola wprowadzania zapytania i przycisku rozpoczęcia wyszukiwania.

Przeszukiwanie dokumentów internetowych oferuje proste i zaawansowane tryby wyszukiwania. Wyszukiwanie proste nie zapewnia żadnych filtrów, co jest kompensowane przez możliwość automatycznego analizowania zapytań w języku naturalnym, niezawodną obsługę stosunkowo długich zapytań oraz system automatycznego uzupełniania zapytań. Maksymalna długość zapytania to czterdzieści słów.

Formularz wyszukiwania zaawansowanego oferuje tylko jedno pole do utworzenia zapytania. Proponuje się ręczne wpisanie operatorów logicznych łączących słowa zapytania, dobrze. Yandex ma dość szczegółowy język zapytań. Pozostałe zaawansowane narzędzia formularzy wyszukiwania to różne filtry (1.4).

Bing

Historia wyszukiwania w Internecie firmy Microsoft nie jest prosta. W przypadku usług stale oferowanych publicznie, algorytmy, używane bazy danych i oczywiście nazwy wielokrotnie się zmieniały. Do początku XXI wieku wyszukiwarka nie posiadała własnych baz danych i pracowała z zewnętrznymi indeksami firm AltaVista, Inktomi i Looksmart. Pierwotna nazwa MSN Search była używana do 2006 roku, a następnie przez kilka lat zmiana nazw wyszukiwarki stała się tradycją firmy Microsoft.

Wraz z ostatecznym przejściem do wyszukiwania w indeksach natywnych nazwa usługi MSN Search została najpierw zmieniona na Windows LiveLive Search. Wreszcie wczesnym latem 2009 r. Usługa Live Search została zastąpiona przez nowy projekt wyszukiwania Bing.

„Bing zapewni inny sposób spojrzenia na sposób wyszukiwania informacji w Internecie i pomoc użytkownikom w podejmowaniu ważnych decyzji” - tak brzmiało ogłoszenie, które rozpoczęło publikację informacji prasowej firmy Microsoft na temat uruchomienia Bing. Aspiracje deweloperów były jasne: wyszukiwarki Microsoftu, mimo wszelkich starań, na Zachodzie konsekwentnie pozostawały w tyle za liderami popularności - Google i Yahoo !. Jeśli mówimy o rosyjskojęzycznych wersjach poprzednich projektów wyszukiwania firmy Microsoft, to pod względem liczby i jakości znalezionych linków były one znacznie gorsze od dużych rosyjskich wyszukiwarek. Starając się dogonić konkurencję, Bing skupił się na poprawie jakości wyszukiwania i wprowadzaniu nowych technologii, z których wiele zostało zakupionych wraz z firmami, które je stworzyły.

Należy zauważyć, że rosyjskojęzyczna wersja Bing, podobnie jak większość innych zlokalizowanych wersji, nie posiada szeregu dodatkowych funkcji, takich jak wyszukiwanie w sklepach. Ponieważ w rzeczywistości działają tylko na północy. Ameryko, nie ma sensu szczegółowo się nad nimi rozwodzić.

Exalead

Jedną z cech Europy, także w zakresie wyszukiwania w Internecie, jest duża liczba języków narodowych. Wyszukiwarka, która twierdzi, że jest wiodącą w Europie, jest po prostu zobowiązana do dobrego indeksowania krajowych segmentów Internetu i przetwarzania zapytań w wielu językach europejskich, zarówno największych, jak i najmniej popularnych, o wysokiej jakości. To właśnie w tej dziedzinie europejski rozwój może uzyskać poważną przewagę konkurencyjną nad potężnymi zagranicznymi konkurentami. System Exalead obecnie poważnie rości sobie rolę takiej europejskiej wyszukiwarki. Projekt ten powstał w ramach programu badawczego Quaere finansowanego przez Unię Europejską.

Exalead ma własne bazy danych indeksów. Głównymi zasobami wyszukiwania systemu są bazy danych dokumentów internetowych, obrazów, filmów i wiadomości. Strona startowa Exalead oferuje opcje dostosowywania. Na tej stronie możesz umieszczać linki do swoich ulubionych stron - będą one wyświetlane w postaci graficznych miniatur-zrzutów ekranu. Jednak w tym celu będziesz musiał zarejestrować konto za darmo, a także zezwolić przeglądarce na przechowywanie plików cookie Exalead.

Wyszukiwanie w Internecie Exalead oferuje proste i zaawansowane tryby wyszukiwania. Formularz wyszukiwania zaawansowanego, podobnie jak w Bing, otwiera się bezpośrednio na stronie wyników wyszukiwania. Zwróć uwagę, że Exalead oferuje nie tylko znajomy formularz z zestawem dodatkowych pól, ale także rozbudowane menu rozwijane, które pełni rolę kreatora do udoskonalania zapytanie (Rys. 1.7). Po wybraniu jednej lub drugiej pozycji w menu kreatora nowe elementy są dodawane do ciągu zapytania oraz, jeśli to konieczne, operatory i znaki specjalne.

Co to jest

DuckDuckGo to dość znana wyszukiwarka open source. Serwery znajdują się w USA. Oprócz własnego robota wyszukiwarka korzysta z wyników innych źródeł: Yahoo, Bing, Wikipedia.

Lepiej

DuckDuckGo pozycjonuje się jako wyszukiwarka, która zapewnia maksymalną prywatność i poufność. System nie zbiera żadnych danych o użytkownikach, nie przechowuje logów (brak historii wyszukiwania), użytkowania ciasteczka tak ograniczone, jak to tylko możliwe.

DuckDuckGo nie zbiera ani nie udostępnia danych osobowych użytkowników. To jest nasza polityka prywatności.

Gabriel Weinberg, założyciel DuckDuckGo

A po co ci to

Wszystkie główne wyszukiwarki starają się personalizować wyniki wyszukiwania na podstawie danych o osobie przed monitorem. Zjawisko to nazywane jest „bańką filtrującą”: \u200b\u200bużytkownik widzi tylko te wyniki, które są zgodne z jego preferencjami lub które system za takie uważa.

Tworzy obiektywny obraz, który nie zależy od Twojego wcześniejszego zachowania w sieci i pozbywa się reklam tematycznych Google i Yandex, w oparciu o Twoje zapytania. DuckDuckGo ułatwia wyszukiwanie informacji języki obce, podczas gdy Google i Yandex domyślnie preferują witryny w języku rosyjskim, nawet jeśli żądanie zostało wprowadzone w innym języku.


Co to jest

not Evil to wyszukiwarka anonimowej sieci Tor. Aby z niego skorzystać, musisz udać się do tej sieci, na przykład uruchamiając specjalistyczną.

not Evil nie jest jedyną wyszukiwarką tego typu. Jest LOOK (domyślne wyszukiwanie w przeglądarce Tor, dostępne ze zwykłego Internetu) lub TORCH (jedna z najstarszych wyszukiwarek w sieci Tor) i inne. Zdecydowaliśmy się na not Evil ze względu na jednoznaczną wskazówkę Google (wystarczy spojrzeć na stronę startową).

Lepiej

Wyszukiwania, w których Google, Yandex i inne wyszukiwarki są zasadniczo zamknięte.

A po co ci to

W sieci Tor jest wiele zasobów, których nie można znaleźć w przestrzegającym prawa Internecie. A ich liczba będzie rosła w miarę zacieśniania przez rząd kontroli nad zawartością sieci. Tor to rodzaj sieci w sieci z własnymi sieciami społecznościowymi, trackerami torrentów, mediami, rynkami, blogami, bibliotekami i tak dalej.

3. YaCy

Co to jest

YaCy to zdecentralizowana wyszukiwarka oparta na sieciach P2P. Każdy komputer, na którym jest zainstalowany główny moduł oprogramowania, samodzielnie skanuje Internet, czyli jest analogiem robota wyszukiwawczego. Wyniki są gromadzone we wspólnej bazie danych, z której korzystają wszyscy uczestnicy YaCy.

Lepiej

Trudno powiedzieć, czy jest tu lepiej, czy gorzej, bo YaCy to zupełnie inne podejście do organizacji wyszukiwania. Brak jednego serwera i firmy będącej właścicielem sprawia, że \u200b\u200bwyniki są całkowicie niezależne od czyichś preferencji. Autonomia każdego węzła wyklucza cenzurę. YaCy jest w stanie przeszukiwać głęboką sieć i nieindeksowane sieci publiczne.

A po co ci to

Jeśli jesteś zwolennikiem oprogramowania open source i wolnego Internetu, na który nie mają wpływu agencje rządowe i duże korporacje, YaCy jest Twoim wyborem. Może być również używany do organizowania wyszukiwań w firmowej lub innej sieci autonomicznej. I chociaż YaCy nie jest zbyt przydatna w życiu codziennym, jest godną alternatywą dla Google pod względem procesu wyszukiwania.

4. Pipl

Co to jest

Pipl to system przeznaczony do wyszukiwania informacji o konkretnej osobie.

Lepiej

Autorzy Pipl twierdzą, że ich wyspecjalizowane algorytmy wyszukują wydajniej niż „zwykłe” wyszukiwarki. W szczególności priorytet mają profile. portale społecznościowe, komentarze, listy uczestników oraz różne bazy danych, w których publikowane są informacje o osobach, np. bazy orzeczeń sądowych. Przywództwo Pipl w tej dziedzinie zostało potwierdzone przez Lifehacker.com, TechCrunch i inne.

A po co ci to

Jeśli potrzebujesz znaleźć informacje o osobie mieszkającej w USA, to Pipl będzie znacznie skuteczniejszy niż Google. Bazy danych rosyjskich sądów są najwyraźniej niedostępne dla wyszukiwarki. Dlatego nie radzi sobie tak dobrze z obywatelami Rosji.

Co to jest

FindSounds to kolejna wyspecjalizowana wyszukiwarka. Przeszukuje otwarte źródła pod kątem różnych dźwięków: domu, natury, samochodów, ludzi itd. Usługa nie obsługuje zapytań w języku rosyjskim, ale istnieje imponująca lista tagów w języku rosyjskim, które można wyszukiwać.

Lepiej

Rezultatem są tylko dźwięki i nic więcej. W ustawieniach możesz ustawić żądany format i jakość dźwięku. Wszystkie znalezione dźwięki są dostępne do pobrania. Istnieje wyszukiwanie wzorców.

A po co ci to

Jeśli potrzebujesz szybko znaleźć odgłos wystrzału z muszkietu, uderzenia ssącego dzięcioła lub krzyk Homera Simpsona, to ta usługa jest dla Ciebie. Wybraliśmy to tylko z dostępnych żądań w języku rosyjskim. W języku angielskim spektrum jest jeszcze szersze.

Poważnie, wyspecjalizowana usługa zakłada wyspecjalizowaną publiczność. Ale co, jeśli się przyda?

Co to jest

Wolfram | Alpha to wyszukiwarka obliczeniowa. Zamiast linków do artykułów zawierających słowa kluczowe, daje gotową odpowiedź na żądanie użytkownika. Na przykład, jeśli wpiszesz w formularzu wyszukiwania „porównaj populacje Nowego Jorku i San Francisco” w języku angielskim, Wolfram | Alpha natychmiast wyświetli tabele i wykresy z porównaniem.

Lepiej

Ta usługa najlepiej nadaje się do wyszukiwania faktów i obliczania danych. Wolfram | Alpha gromadzi i porządkuje wiedzę dostępną w sieci z różnych dziedzin, w tym nauki, kultury i rozrywki. Jeśli ta baza danych zawiera gotową odpowiedź na zapytanie, system ją pokazuje, jeśli nie, oblicza i wyświetla wynik. W tym przypadku użytkownik widzi tylko i nic zbędnego.

A po co ci to

Jeśli jesteś na przykład studentem, analitykiem, dziennikarzem lub naukowcem, możesz skorzystać z Wolfram | Alpha, aby znaleźć i obliczyć dane związane z Twoją pracą. Usługa nie rozumie wszystkich żądań, ale stale się rozwija i staje się inteligentniejsza.

Co to jest

Silnik metasearch Dogpile wyświetla połączoną listę wyników z wyników wyszukiwania z Google, Yahoo i innych popularnych wyszukiwarek.

Lepiej

Po pierwsze, Dogpile wyświetla mniej reklam. Po drugie, usługa wykorzystuje specjalny algorytm do wyszukiwania i wyświetlania najlepszych wyników z różnych wyszukiwarek. Według twórców Dogpile ich system generuje najpełniejsze wyniki wyszukiwania w całym Internecie.

A po co ci to

Jeśli nie możesz znaleźć informacji w Google lub innej standardowej wyszukiwarce, wyszukaj je w kilku wyszukiwarkach jednocześnie, używając Dogpile.

Co to jest

BoardReader to system wyszukiwania tekstu dla forów, usług pytań i odpowiedzi oraz innych społeczności.

Lepiej

Usługa umożliwia zawężenie pola wyszukiwania do platform społecznościowych. Dzięki specjalnym filtrom szybko znajdziesz posty i komentarze pasujące do Twoich kryteriów: języka, daty publikacji i nazwy strony.

A po co ci to

BoardReader może być przydatny dla specjalistów od PR i innych profesjonalistów medialnych, którzy są zainteresowani opinią masy na określone tematy.

Wreszcie

Życie alternatywnych wyszukiwarek jest często ulotne. Lifehacker zapytał Siergieja Petrenkę, byłego dyrektora generalnego ukraińskiego oddziału Yandex, o długoterminowe perspektywy takich projektów.


Sergey Petrenko

Były dyrektor generalny Yandex.Ukraine.

Co do losu alternatywnych wyszukiwarek, to jest proste: być bardzo niszowymi projektami z małą liczbą odbiorców, a więc bez wyraźnych perspektyw handlowych, lub odwrotnie, z całkowitą jasnością ich braku.

Jeśli spojrzysz na przykłady w artykule, zobaczysz, że takie wyszukiwarki albo specjalizują się w wąskiej, ale pożądanej niszy, która, być może tylko do tej pory, nie urosła na tyle, by być zauważalną na radarach Google lub Yandex, albo one testują oryginalną hipotezę w rankingu, która nie ma jeszcze zastosowania w zwykłym wyszukiwaniu.

Na przykład, jeśli wyszukiwanie w Torze nagle okaże się pożądane, to znaczy wyniki z niego będą potrzebne przynajmniej przez procent odbiorców Google, to oczywiście zwykłe wyszukiwarki zaczną rozwiązywać problem jak je znaleźć i pokazać użytkownikowi. Jeśli zachowanie odbiorców pokazuje, że wyniki wydają się bardziej trafne dla znacznej części użytkowników w znacznej liczbie zapytań, danych bez uwzględnienia czynników zależnych od użytkownika, to Yandex lub Google zaczną dawać takie wyniki.

„Być lepszym” w kontekście tego artykułu nie oznacza „być lepszym we wszystkim”. Tak, pod wieloma względami nasi bohaterowie są daleko od Yandex (nawet Bing jest daleko). Ale z drugiej strony każda z tych usług daje użytkownikowi coś, czego nie mogą zaoferować giganci branży wyszukiwania. Prawdopodobnie znasz też podobne projekty. Podziel się z nami - omówimy.

Wprowadzenie

Obecnie Internet łączy setki milionów serwerów, na których znajdują się miliardy różnych witryn i pojedynczych plików zawierających różnego rodzaju informacje. To gigantyczne repozytorium informacji. Istnieje wiele metod wyszukiwania informacji w Internecie.

Wyszukaj znany adres. Niezbędne adresy są pobierane z katalogów. Znając adres, wystarczy wpisać go w pasku adresu przeglądarki.

Przykład 1. www.gov.ru jest serwerem rosyjskich władz państwowych.

Budowa adresu przez użytkownika.Znając system tworzenia adresów internetowych, możesz konstruować adresy podczas wyszukiwania witryn sieci Web.

Do słowa kluczowego należy dodać domenę tematyczną lub geograficzną (nazwa firmy, przedsiębiorstwa, organizacji lub prosty rzeczownik w języku angielskim) oraz podać intuicję.

Przykład 2. Adresy komercyjnych stron internetowych:

www.samsung.com (firma SAMSUNG),

www.mtv.com (MTV Music News).

Przykład 3. Adresy instytucji edukacyjnych:

www.ntu.edu (Uniwersytet Narodowy USA).

Wyszukiwarki internetowe

Aby wyszukiwać informacje w Internecie, opracowano specjalne systemy wyszukiwania informacji. Wyszukiwarki mają wspólny adres i są wyświetlane jako strony internetowe zawierające specjalne narzędzia do organizowania wyszukiwania (ciąg wyszukiwania, katalog tematyczny, linki). Aby zadzwonić do wyszukiwarki, wystarczy wpisać jej adres w pasku adresu przeglądarki.

Według serwisu statystycznego LiveInternet.ru dystrybucja wyszukiwarek w Rosji jest w przybliżeniu następująca:

2) Google - 35,0%

3) Przeszukaj Mail.ru - 8,3%

4) Rambler - 0,9%

Zgodnie ze sposobem organizacji informacji systemy wyszukiwania informacji dzielą się na dwa typy: klasyfikacyjne (rubrykatory) i słownikowe.

Rubrykatory (klasyfikatory) - wyszukiwarki, które wykorzystują hierarchiczną (drzewiastą) organizację informacji. Podczas wyszukiwania informacji użytkownik przegląda nagłówki tematyczne, stopniowo zawężając pole wyszukiwania (na przykład, jeśli chcesz znaleźć znaczenie słowa, najpierw musisz znaleźć słownik w klasyfikatorze, a następnie znaleźć żądane słowo w tym).



Wyszukiwarki słownikowe to potężne automatyczne systemy sprzętowe i programowe. Z ich pomocą informacje są przeglądane (skanowane) w Internecie. Dane dotyczące lokalizacji tej lub innej informacji są wprowadzane do specjalnych indeksów książek referencyjnych. W odpowiedzi na zapytanie wyszukiwanie jest przeprowadzane zgodnie z ciągiem zapytania. W rezultacie użytkownikowi są oferowane adresy (URL), pod którymi zostało znalezione wyszukiwane słowo lub grupa słów w momencie skanowania. Wybierając dowolne z sugerowanych łączy URL, możesz przejść do znalezionego dokumentu. Większość nowoczesnych wyszukiwarek jest mieszana.

Najbardziej znane i popularne wyszukiwarki:

Istnieją systemy specjalizujące się w wyszukiwaniu zasobów informacyjnych z różnych dziedzin.

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com itp.

Wyszukiwarki tematyczne:

Szukaj oprogramowanie:

Katalogi (tematyczne zbiory linków z adnotacjami):

http://www.atrus.ru

Żądaj reguł wykonania

W każdej wyszukiwarce, w sekcji Pomoc, można uzyskać informacje na temat wyszukiwania, tworzenia ciągu zapytania. Poniżej znajdują się informacje o typowym, „przeciętnym” języku zapytań.

Proste zapytanie

Wpisz jedno słowo określające temat wyszukiwania. Na przykład w wyszukiwarce Rambler.ru wystarczy wpisać: automatyczny.

Istnieją dokumenty zawierające słowa określone w żądaniu. Rozpoznawane są wszystkie formy słów języka rosyjskiego, z reguły wielkość liter jest ignorowana.

W zapytaniu można użyć znaku „*” lub „?”. Znak "?" w słowie kluczowym zastępowany jest jeden znak, który można zastąpić dowolną literą, a znak „*” jest ciągiem znaków.

Na przykład zapytanie automatyczne * pozwoli Ci znaleźć dokumenty zawierające słowa automatyczne, automatyczne itp.

Złożone zapytanie

Często konieczne jest łączenie słów kluczowych, aby uzyskać bardziej szczegółowe informacje. W tym przypadku używane są dodatkowe słowa łączące, funkcje, operatory, symbole, kombinacje operatorów, oddzielone nawiasami.

Na przykład zapytanie music & (beatles beatles) oznacza, że \u200b\u200bużytkownik szuka dokumentów zawierających słowa music i beatles lub music and the beatles.

Lista wyszukiwarek i katalogów

Adres Opis
www.excite.com Wyszukiwarka z recenzjami witryn i przewodnikami
www.alta-vista.com Serwer wyszukiwania, dostępne zaawansowane możliwości wyszukiwania
www.hotbot.com Wyszukaj serwer
www.ifoseek.com Wyszukiwarka (łatwa w użyciu)
www.ipl.org Biblioteka Internet Publik, biblioteka publiczna prowadzona w ramach projektu World Village
www.wisewire.com WiseWire - Wyszukiwanie sztucznej inteligencji
www.webcrawler.com WebCrawler - wyszukiwarka, łatwa w użyciu
www.yahoo.com Katalog sieciowy i interfejs umożliwiający dostęp do wyszukiwania pełnotekstowego na serwerze AltaVista
www.aport.ru Aport - serwer wyszukiwania w języku rosyjskim
www.yandex.ru Yandex - serwer wyszukiwania w języku rosyjskim
www.rambler.ru Rambler - serwer wyszukiwania w języku rosyjskim
Zasoby pomocy online
www.yellow.com Internetowe książki telefoniczne
monk.newmail.ru Wyszukiwarki o różnych profilach
www.top200.ru 200 najpopularniejszych witryn internetowych
www.allru.net
www.ru Katalog rosyjskich zasobów internetowych
www.allru.net/z09.htm Zasoby edukacyjne
www.students.ru Serwer rosyjskich studentów
www.cdo.ru/index_new.asp Centrum kształcenia na odległość
www.open.ac.uk Otwarty Uniwersytet Wielkiej Brytanii
www.ntu.edu Narodowy Uniwersytet Stanów Zjednoczonych
www.translate.ru Elektroniczny tłumacz tekstu
www.pomorsu.ru/guide.library.html Lista linków do bibliotek sieciowych
www.elibrary.ru Naukowa biblioteka elektroniczna
www.citforum.ru Biblioteka elektroniczna
www.infamed.com/psy Testy psychologiczne
www.pokoleniye.ru Witryna internetowa Federacji Edukacji Internetowej
www.metod.narod.ru Zasoby edukacyjne
www.spb.osi.ru/ic/distant Kształcenie na odległość przez Internet
www.examen.ru Egzaminy i testy
www.kbsu.ru/~book/ Podręcznik informatyki
Mega.km.ru Encyklopedie i słowniki

Profesjonalne wyszukiwanie informacji w Internecie

Wyszukiwanie informacji jest jednym z najczęstszych i jednocześnie najtrudniejszych zadań, z jakimi musi się zmierzyć każdy użytkownik w Internecie. Jeśli jednak dla zwykłego członka społeczności sieciowej znajomość skutecznych metod wyszukiwania informacji jest pożądana, ale daleka od obowiązkowej jakości, dla informatyków umiejętność szybkiego poruszania się po zasobach Internetu i znajdowania potrzebnych źródeł jest jedną z podstawowych kwalifikacji.

Przyczyną trudności napotykanych w wyszukiwaniu informacji w Internecie są dwa główne czynniki. Po pierwsze, liczba źródeł w sieci jest niezwykle duża. Pod koniec 2001 roku, według najbardziej przybliżonych szacunków, na serwerach na całym świecie znajdowało się około 7,5 miliarda dokumentów. Po drugie, wachlarz informacji w sieci jest nie tylko kolosalny, ale także niezwykle dynamiczny. W ciągu pół minuty, które spędziłeś na czytaniu pierwszych wierszy tej sekcji, w wirtualnym wszechświecie pojawiło się około stu nowych lub zmienionych dokumentów, dziesiątki przeniesiono pod nowe adresy, a kilka z nich przestało istnieć na zawsze. Internet nigdy nie „śpi”, tak jak nasza planeta nigdy nie „śpi”, na której nieustannie toczy się fala aktywności biznesowej ludzkości, dokładnie zgodnie ze zmianą stref czasowych.

W przeciwieństwie do stabilnego i kontrolowanego zbioru dokumentów w bibliotece, w sieci mamy do czynienia z gigantycznym i ciągle zmieniającym się szeregiem informacji, w których wyszukiwanie danych jest bardzo, bardzo trudnym procesem. Sytuacja jest często bardzo podobna do dobrze znanego problemu znalezienia igły w stogu siana, a czasami informacje o dużej wartości pozostają nieodebrane tylko ze względu na trudność ich znalezienia.

Większość użytkowników globalnych sieci komputerowych ma mniej lub więcej umiejętności wyszukiwania informacji. Zarówno amatorzy, jak i profesjonaliści często używają tych samych narzędzi. Jednak wyniki ankiet i spędzony na nich czas różnią się w bardzo dużym stopniu.

Celem tej sekcji jest szczegółowe zapoznanie się z narzędziami i metodami wyszukiwania informacji oraz rozwinięcie trwałych umiejętności profesjonalnego wyszukiwania w Internecie wszystkich typów danych: od tekstów w dowolnym formacie po filmy i animacje.


Porozmawiaj o tym, co jest obecnie technologie informacyjne i niekończący się wzrost ilości danych dostępnych zarówno jednostce, jak i społeczeństwu, jest wiele problemów z przetwarzaniem informacji i ich wyszukiwaniem - to już bluźnierstwo. Kto po prostu nie porusza tego tematu. Aby nie obciążać Was subiektywnymi, a częściowo obiektywnymi ocenami, zaczerpniętymi z różnych źródeł informacji na temat problemu, przejdę bezpośrednio do jego rozwiązania. Dzisiaj porozmawiamy o wyszukiwaniu. To znaczy o programach i poważnych systemach informacyjnych, które wyszukują potrzebne nam dokumenty i dane.

Aktualizacja wyszukiwania bezpośredniego

Nie tak dawno temu, kiedy drzewa były duże, a informacje nawet w środku lokalna sieć nie było tak wielu przedsiębiorstw, każde wyszukiwanie było przeprowadzane poprzez banalne przeszukiwanie kilku dostępnych plików i sekwencyjne sprawdzanie ich nazw i zawartości. Takie wyszukiwanie nazywa się bezpośrednim, a programy (narzędzia), które używają technologii wyszukiwania bezpośredniego, są tradycyjnie obecne we wszystkich system operacyjny i pakiety instrumentalne. Jednak nawet moc nowoczesnych komputerów nie jest wystarczająca do szybkiego i odpowiedniego wyszukiwania ogromnych ilości danych w wyszukiwaniu bezpośrednim. Przeglądanie kilkuset dokumentów na dysku i przeszukiwanie ogromnej biblioteki i kilkudziesięciu skrzynek pocztowych to dwie różne rzeczy. Dlatego programy do bezpośredniego wyszukiwania dziś wyraźnie odchodzą na dalszy plan - jeśli chodzi o środki uniwersalne.

Oczywiście tego typu poszukiwania od dawna nie były pożądane w sektorze przedsiębiorstw. Woluminy nie są takie same. I dlatego od wielu lat, a ostatnio jest to jednoznaczne, technologie zdolne do szybkiego i szybkiego dokładne wyszukiwanie dokumenty w różnych formatach iz różnych źródeł są więcej niż istotne. Nie tak dawno „tata” Microsoftu, Bill Gates, zazdroszcząc najwyraźniej fenomenalnego sukcesu wyszukiwarki internetowej Google, na jednej z konferencji prasowych ogłosił chęć oprogramowania (i nie tylko) do promowania, rozwijania i pogłębiania tworzenie wyszukiwarek i technologii w każdy możliwy sposób. Ale jest za wcześnie, aby stworzyć jakikolwiek fenomenalnie działający program od Microsoftu lub konkurencyjnego serwera w Internecie (MSN wciąż brakuje Google). Dlatego zwróćmy się do już istniejących rozwiązań. Indeks, zapytanie, trafność

W sercu nowoczesne technologie istnieją dwa podstawowe procesy. Najpierw indeksuje dostępne informacje i przetwarza żądanie z późniejszymi wynikami. W pierwszym przypadku każdy program (czy to wyszukiwarka na pulpicie, korporacyjny system informacyjny czy wyszukiwarka internetowa) tworzy własny obszar wyszukiwania. Oznacza to, że przetwarza dokumenty i tworzy indeks tych dokumentów (zorganizowana struktura zawierająca informacje o przetwarzanych danych). W przyszłości to właśnie utworzony indeks służy do pracy - szybkie uzyskanie listy niezbędnych dokumentów zgodnie z żądaniem. Reszta, choć nie jest prosta pod względem technologicznym, jest całkiem zrozumiała dla zwykłego użytkownika. Program przetwarza żądanie (dla frazy kluczowej) i wyświetla listę dokumentów, które zawierają tę frazę kluczową. Ponieważ informacje zawarte są w ustrukturyzowanym indeksie, przetwarzanie zapytania jest znacznie (dziesiątki i setki razy!) Szybsze niż w przypadku wyszukiwania bezpośredniego (selekcja dokumentów odbywa się nie poprzez wyliczanie plików, ale analizę informacje tekstowe w indeksie).

Program wyświetla znalezione dokumenty w wynikowej liście według trafności - zgodności dokumentu z tekstem zapytania. W różnych technologiach istnieją oczywiście różne metody wyszukiwania i określania trafności dokumentu (liczba „wystąpień” słowa i częstotliwość jego występowania w dokumencie, stosunek tych parametrów do całkowitej liczby słów w dokumencie odległość między słowami frazy zapytania w wyszukiwanych plikach itd.). Na podstawie tych parametrów określana jest „waga” dokumentu i, w zależności od tego, ten lub inny plik pojawia się na liście wyników w określonej pozycji. W przypadku wyszukiwań w Internecie sytuacja jest jeszcze bardziej skomplikowana. Rzeczywiście, w tym przypadku należy wziąć pod uwagę wiele innych czynników (przykładem jest PageRank Google). Ale to temat na osobny artykuł, więc nie będziemy dotykać internetu.

W tym artykule omówiono możliwości kilku popularnych programów wyszukiwania, które mogą pochwalić się zarówno przyzwoitymi prędkościami, jak i dobrą funkcjonalnością. Ale przechwalanie się w broszurach reklamowych to jedno, a wytrzymywanie spojrzenia eksperta to zupełnie co innego. A eksperci nie znaleźli ani więcej, ani mniej niż pełne biuro fanów, którzy wybrali oprogramowanie ze względu na jego użyteczność. Na komputerze testowym (Athlon 2,2 MHz, 1 GB pamięci RAM, dysk twardy 160 GB IDE Seagate przy 7200 obr./min i system Windows XP) został zainstalowany zestaw programów: dtSearch Desktop, Snoop Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Do testów została skompilowana baza tekstowa dokumentów w formatach doc, txt i html o łącznej wielkości nie większej, nie mniejszej, ale 20 gigabajtów. Grupa towarzyszy pod kierunkiem twojego pokornego sługi testowała, porównywała i dzieliła się swoimi subiektywnymi wrażeniami na temat każdego oprogramowania. Przeczytaj podsumowanie wyników poniżej. dtSearch Desktop

Program, który według twórców jest najszybszą, najwygodniejszą i najlepszą wyszukiwarką. Jak ogólnie i wszyscy inni z tej recenzji. Interfejs DtSearch jest dość prosty, ale niektóre okna lub karty są nieco przeładowane elementami, co sprawia wrażenie trudnych w użyciu. Ale w rzeczywistości nie ma szczególnych trudności. Jedynym naprawdę nieprzyjemnym momentem jest brak wsparcia dla oprogramowania w języku rosyjskim (pomimo tego, że program może wyszukiwać dokumenty w kilku językach, jego interfejs jest wyłącznie angielski).

Jednak dtSearch jest jednym z nielicznych programów, które mogą indeksować strony internetowe do określonej przez użytkownika „głębokości” (aczkolwiek biorąc pod uwagę „dodatkowy zakup” w zestawie dodatkowym dtSearch Spider). Jest to dodatek do obsługi plików na dysku w różnych formatach tekstowych i wiadomości e-mail od skrzynka pocztowa Perspektywy. Jednocześnie program nie wie, jak pracować z bazami danych, które są tak łakomym kąskiem dla wyszukiwarek ze względu na dużą ilość informacji w nich i powszechne wykorzystanie w firmach, a co za tym idzie w sieciach korporacyjnych. Szybkość indeksowania dokumentów dtSearch okazała się na odpowiednim poziomie. Patrząc w przyszłość powiem, że program ten poradził sobie z zaindeksowaniem określonej ilości informacji na poziomie z innym konkurentem - iSYS - i podzielił się z nim drugim miejscem na liście najszybszych systemów. DtSearch zindeksował test 20 gigabajtów informacji w 6 godzin 13 minut, tworząc indeks 7,9 GB na potrzeby kolejnych wyszukiwań.

Jeśli chodzi o możliwości wyszukiwania, tutaj są one na odpowiednim poziomie. Po pierwsze, istnieje wyszukiwanie morfologiczne w dtSearch (szukanie słowa we wszystkich jego formach morfologicznych). Za pomocą ta okazja, uwalniasz się od, powiedzmy, myśli typu „w jakim przypadku w dokumencie, którego potrzebuję, użyto jakiegoś słowa?” Korzystanie z wyszukiwania morfologicznego jest prawie zawsze uzasadnione, dlatego powinno być obecne w każdej profesjonalnej wyszukiwarce.

Wyszukiwanie dźwięku to niestandardowa funkcja nawet dla profesjonalnych wyszukiwarek. Jego istota polega na tym, że program wyszuka słowa, które brzmią tak samo, jak wpisane przez Ciebie słowo. A co najważniejsze, ta funkcja działa również w języku rosyjskim! Na przykład wpisanie słowa „ucho” w zapytaniu spowoduje wyświetlenie w wynikach nie tylko słów „ucho”, ale także „ucho”.

Wyszukiwanie korekcji błędów jest bardzo ważną funkcją. Służy do wyszukiwania słów zawierających błędy składniowe - mogą to być zarówno literówki, jak i błędy w dokumentach pozyskanych np. Z wykorzystaniem systemów rozpoznawania znaków. Prosty przykład - szukasz klawiatury słownej. Jakiś dokument zawiera słowo „klawiatura”, jest oczywiste, że w rzeczywistości jest to słowo „klawiatura”, wpisana została tylko osoba wpisująca tekst. Teraz wyszukaj z korekcją błędów, to wykryje i dołączy w wyniku dokument ze słowem „klawiatura”. Również w dtSearch istnieje ustawienie, które pozwala określić stopień możliwych błędnych znaków.

Szukaj, używając synonimów. Ta funkcja wykorzystuje listę synonimów różnych słów. Na przykład wpisując słowo „szybko”, program znajdzie również słowa „szybko” i inne, które są synonimami słowa „szybko”, o ile takie oczywiście znajdują się na liście synonimów. W programie dtSearch nie jest dostarczana gotowa lista synonimów, jednak istnieje możliwość skorzystania z list w Internecie (w związku z tym wymagane jest połączenie, co nie zawsze jest wygodne) lub można stworzyć własną listę synonimy.

Oprócz wymienionych funkcji dtSearch może wyszukiwać za pomocą fraz składających się ze słów połączonych operacjami logicznymi. Każdemu słowu w zapytaniu można przypisać własną „wagę”, czyli znaczenie. Przydatną opcją jest użycie słownika składającego się z nieistotnych słów, aby nie brać ich pod uwagę podczas wyszukiwania, ale ten słownik również jest pusty i będziesz musiał go wypełnić samodzielnie.

Następnie rozważymy możliwości programu podczas pracy w sieci. W rzeczywistości dtSearch nie oferuje żadnych konkretnych możliwości sieciowych. Niemniej jednak korzystanie z niego w sieci jest całkiem możliwe. Alternatywnie możesz utworzyć jakiś indeks i umieścić go w folderze publicznym (udostępnionym). Sam program może zostać zainstalowany przez każdego użytkownika na komputerze lub możesz go również umieścić w folderze otwartym dla ogólny dostępi utwórz skróty w specjalny sposób dla każdego użytkownika z osobna, używając parametrów wiersz poleceń, którego przeznaczenie jest opisane w pliku pomocy dołączonym do programu. Jest też taka możliwość automatyczna instalacja programy do sieci przy użyciu pliku MSI. Uwzględni to ustawienia dla każdego podłączonego użytkownika.

Ogólnie jest to dobry program z kategorii profesjonalnych wyszukiwarek. Może twierdzić, że jest dobrą oceną, ale zdobycie zaufania i szacunku ze strony użytkowników może być trudne dla dtSearch ze względu na pewne czynniki (nie wszystko jest płynne z interfejsem, rosyjscy użytkownicy są pozbawieni, nie ma jasnych funkcji do pracy z siecią) . Jeśli chodzi o wyszukiwanie dokumentów bezpośrednio, program nie pokrywał się z tekstem rosyjskim. Ponieważ nie było żadnego z zadeklarowaną morfologią ani z wyszukiwaniem rozmytym. System całkiem adekwatnie znaleziony wymagane dokumenty i za pomocą prostego zapytania w jednym słowie i używając kilku akapitów dokumentu jako frazy kluczowej.

Oficjalna strona:
Rozmiar dystrybucji: 23 Mb

Na podstawie nazwy można zgadnąć, że w tym programie jest obsługa języka rosyjskiego. To już jest fajne. Jeśli chodzi o interfejs, ogólnie jest dość nietypowy, ale wygląda bardzo atrakcyjnie. Wygoda to inna sprawa. Kryterium wysoce kontrowersyjne, ale prawdopodobnie rozwiązanie z wieloma oknami nie jest najlepszą opcją (żądanie jest wpisywane w jednym oknie, wynik jest wyświetlany w innym i tym podobne).

Snoop używa tych samych indeksów do wykonywania szybkich wyszukiwań, ale indeksowanie jest znacznie wolniejsze niż w przypadku innych programów. Jest to bardzo dziwne, zwłaszcza biorąc pod uwagę, że jego możliwości przetwarzania zapytań wyszukiwania są bardzo słabe, co oznacza, że \u200b\u200bstruktura indeksu nie jest skomplikowana. Najprawdopodobniej jest to spowodowane niezoptymalizowanymi algorytmami. Ten program okazał się wyraźnym outsiderem pod względem szybkości indeksowania i wyszukiwania: czas spędzony na tworzeniu indeksu jest sześć razy dłuższy niż w przypadku tego samego dtSearch i iSYS. Indeksowanie 20 gigabajtów tekstu dla ogara zajęło 38 godzin 46 minut pracy. Utworzony „obszar wyszukiwania” zajmował na dysku twardym taki sam rozmiar jak oryginalne dane z niewielkim minusem - 19 gigabajtów.

Snoop można przedstawić jako alternatywę dla standardowego wyszukiwania systemu Windows, prawie nie jest w stanie więcej. Fakt, że podstawowym zadaniem Snooperów jest najprostsze wyszukiwanie plików, wskazuje nie tylko na niewielką liczbę funkcji do analizy tekstu zapytań wyszukiwania i zaawansowanego wyszukiwania według atrybutów plików, ale nawet okno wyników, które wyświetla bezpośrednie linki do znalezionych plików, a także do folderów zawierających te pliki. Okno wyników nie zawiera zbyt wielu informacji w tym sensie, że cały znaleziony plik można odczytać tylko przez uruchomienie go, to znaczy, że nie ma wbudowanej przeglądarki plików. Z drugiej strony wyświetlany jest fragment pliku, w którym znaleziono wyszukiwane słowo, ogólnie taki schemat wyświetlania jest bardzo podobny do wyszukiwarek internetowych.

Mówiąc o konkretnych możliwościach przetwarzania zapytań wyszukiwania, warto zwrócić uwagę, że nie ma czegoś takiego jak „szukaj tekstu”, maksimum, jakie można wyszukać, to fraza, choćby dlatego, że nie ma wielowierszowego pola tekstowego. Niemniej jednak możesz przeanalizować wprowadzoną frazę, a Snooper oferuje nam standardowe wyszukiwanie ustawione tutaj: operacje logiczne, wyszukiwanie maski i wyszukiwanie cudzysłowów ... niewiele. Program zawiera pewne podstawy poszukiwań morfologicznych, ale zapewne jest na tyle prymitywny, że raczej przeszkadza w poprawnej pracy (podczas testów zauważono wiele nakładek z nieprawidłowym użyciem morfologii).

Ale program pozwala określić podczas wyszukiwania atrybutów plików (data dokumentu, nazwa pliku, nazwa folderu), aw tych zapytaniach można również użyć tego samego zestawu wyszukiwania. Możesz także wyszukiwać litery, określając parametry (Od, Temat ... itd.).

A więc z samym wyszukiwaniem ustaliliśmy, co jeszcze jest ciekawego w programie, za który otrzymał tak wiele nagród, według informacji z oficjalnej strony internetowej? Trudno powiedzieć, co jest w nim takiego specjalnego, najprawdopodobniej interfejs Snoopera sam sobie radzi (tylko na zewnątrz, nie wspominając o użyteczności).

Operacje na indeksach są dość standardowe, ale fajną rzeczą jest możliwość aktualizacji indeksów zgodnie z harmonogramem. Ponadto indeksy mogą być również używane w Internecie. Od teraz potrzeba więcej szczegółów.

Mimo prymitywności zapytań wyszukiwawczych program można wykorzystać do wyszukiwania plików, więc jego użycie w sieciach może być uzasadnione. Choć z dużym naciągiem, ponieważ w dużej sieci priorytetowym zadaniem jest szybkie wyszukiwanie danych za pomocą złożonych zapytań wyszukiwania ze względu na ogromną ilość informacji - ale są wyraźne problemy z szybkością wyszukiwania i programem. Muszę powiedzieć, że praca Bloodhounda z siecią jest dobrze przemyślana. Specjalnie do tego stworzona jest osobna aplikacja - Snoop Server. Działa tak samo jak zwykły Snooper (mają jedną wyszukiwarkę), tylko w przypadku dokumentów znajdujących się na centralnym serwerze lub we współdzielonych zasobach w sieci firmowej. Snoop Server tworzy nowe indeksy na współdzielonych zasobach lub używa wcześniej utworzonych. Każdy użytkownik w sieci firmowej może połączyć się z serwerem Snoop i używać go do uzyskiwania dostępu do dowolnego dokumentu (znajdującego się w bieżącym indeksie) za pomocą przeglądarki internetowej. Zgadzam się, taki schemat jest niezwykle wygodny: okazuje się, że pliki we własnej sieci można przeszukiwać tak samo, jak informacje w Internecie np. Przez Google.

Oceniając wszystkie zalety i wady tego programu, wniosek sam w sobie sugeruje, że dla sieci korporacyjnych jego możliwości są najprawdopodobniej niewystarczające (pomimo nawet dobrej organizacji pracy z siecią), ale dla komputera domowego lub nawet dla sieci domowej to w zasadzie może się pojawić. Chociaż ani szybkość pracy, ani możliwości wyszukiwania nie zachęcają ...

Oficjalna strona internetowa w języku rosyjskim:
Rozmiar dystrybucji: 6 MbGoogle Desktop Search + GDS Enterprise

Oczywiście nie mogliśmy zignorować tak wybitnego dewelopera. Nazwa Google już wiele mówi. Osoby, które od lat korzystają z najpotężniejszej wyszukiwarki internetowej z pewnością bez wątpienia zdecydują się na zainstalowanie tej właśnie wyszukiwarki na swoim komputerze. Pomyśl o tym: Google na Twoim domowym komputerze! Nie ulegając jednak prowokacjom szeroko promowaną marką, spróbujmy trzeźwo i co najważniejsze obiektywnie rozważyć możliwości wyszukiwarki Google „desktopowej”.

Pierwszą rzeczą, która rzuca się w oczy, jest brak własnej powłoki programu. Google Desktop Search jest nadal w oknie przeglądarki, więc cały interfejs wersji desktopowej ma oprogramowanie od starszego brata internetowego. Dobra czy zła to kwestia kontrowersyjna: ktoś lubi minimalizm w projektowaniu tej wyszukiwarki, ale ktoś chce zobaczyć pełnoprawną aplikację wypełnioną różnego rodzaju przyciskami i tak dalej.

Co rzuca się w oczy zaraz po wykonaniu projektu? I fakt, że ta sama wyszukiwarka Google Desktop zaczyna indeksować wszystko na twoim komputerze, bez żadnego żądania! A najciekawsze jest to, że nie można wybrać ścieżek indeksowania za pomocą Google Desktop Search. Będziesz musiał pobrać osobny program (TweakGDS), który pozwoli ci nieco rozszerzyć ustawienia Google Desktop, w tym określić miejsca niezbędne do indeksowania. Chociaż, dopóki tego nie wymyślisz, będzie już indeksował standardowy dysk twardy, więc takie ustawienie jest potrzebne raczej podczas pracy z dużymi ilościami danych, co jest bardzo ważne w sieciach korporacyjnych (wersja Enterprise). Jednak nie jest faktem, że po pobraniu TweakGDS Twoje problemy zostaną rozwiązane. W końcu potrzebuje Microsoft do pracy. NET Framework i Microsoft Scripting Runtime. Tak ... instalacja, podobnie jak dostęp do ustawień, mogła zostać ułatwiona, choć być może programiści zrozumieją: po co pisać coś nowego, skoro jest gotowa wyszukiwarka, przeportowali ją na lokalny komputer i pozwól użytkownikowi „cieszyć się”, a dobrze znana nazwa uczyni „to” kolejnym arcydziełem. Chodź, zakończmy liryczną dygresję na ten temat i przejdźmy do poszukiwań.

Jeśli chodzi o analizę zapytań wyszukiwania i wydawanie wyników, wszystko tutaj jest absolutnie identyczne z Google w Internecie: ten sam system wyświetlania wyników, ten sam standardowy zestaw operacji logicznych dla zapytań wyszukiwania. Ogólnie rzecz biorąc, Google Desktop Search, podobnie jak poprzedni program, jest przeznaczony wyłącznie do wyszukiwania plików - oczywiście nie ma wewnętrznej przeglądarki tych plików. Liczba formatów plików obsługiwanych przez Google Desktop Search jest wystarczająca, a także fajnie, że przeszukuje odwiedzane strony internetowe, pobierając dane z pamięci podręcznej. Prędkości wyszukiwania i indeksowania są całkiem do przyjęcia. To prawda, do użytku domowego. Wyszukiwarka Google Desktop poradziła sobie z imponującymi 20 gigabajtami tekstu w 8 godzin i 17 minut. Spędzenie kilku dni na przetwarzaniu informacji z sieci korporacyjnej dużego przedsiębiorstwa nie jest powodem do uśmiechu do żadnego administratora systemu. Na plus: rozmiar utworzonego indeksu okazał się na poziomie (4,5 GB) z inną wyszukiwarką testowaną w tej recenzji - SearchInform.

Dużą zaletą (lub przeoczeniem) wyszukiwarki Google Desktop jest to, że obsługuje ona wtyczki, które mogą mieć znaczenie. Inną rzeczą jest to, że podłączenie wtyczek i ich skonfigurowanie tak bardzo komplikuje zadanie instalacji wyszukiwarki, że zaczynasz się zastanawiać, czy to wszystko jest konieczne, gdy możesz zainstalować normalny, pełnoprawny program, w którym wszystko będzie już obecne. W końcu, aby korzystać z każdej funkcji, będziesz musiał zainstalować nową wtyczkę. Nawet aby program mógł w pełni współpracować z archiwami, potrzebny jest osobny gadżet. Swoboda wszystkich tych dodatkowych modułów fascynuje i uwodzi. Jeśli jednak nie weźmiesz pod uwagę wersji wyszukiwarki na komputery stacjonarne, to kompetentne skonfigurowanie GDS Enterprise może nie leżeć w Twoich możliwościach - nie bez powodu eksperci z Google oferują swoje usługi w zakresie konfiguracji własnego oprogramowania dla Twojego sieć za jedyne 10 000 USD.

Jeśli nadal opanujesz procedurę konfiguracji i instalacji (lub zapłacisz 10 000 USD zespołowi szybkiego reagowania z biura Google), zrozumiesz, że złożoność instalacji jest więcej niż rekompensowana bardzo elastycznymi ustawieniami w sieciach korporacyjnych. Ważnym aspektem pracy Google Desktop w sieci firmowej jest wykorzystanie zasady grupy, co umożliwia skonfigurowanie ustawień dla każdego użytkownika.

Podsumowując, należy powiedzieć, że najbardziej rozsądną aplikacją dla tego programu jest komputer domowy lub służbowy. Przecież w przypadku zwykłego komputera wystarczy po prostu zainstalować program - resztę zrobi on sam (nawet o nic Cię nie zapyta).

Niemniej jednak Google Desktop Search Enterprise będzie dopuszczalny w przypadkach, gdy istnieje pilna potrzeba elastycznej konfiguracji zasad sieciowych do korzystania z wyszukiwarki, podczas gdy możliwość przetwarzania zapytań wyszukiwania będzie na drugim miejscu, a czas (lub pieniądze) spędzony po założeniu programu będzie na pierwszym miejscu.

Oficjalna strona:
Rozmiar dystrybucji z TweakGDS: 1,2 Mb Copernic Desktop Search

Kliknij na zdjęcie, aby powiększyć

Interfejs programu wywołuje niezwykle pozytywne emocje - wszystko odbywa się zgodnie z ogólnie przyjętymi standardami, nic zbędnego, jednym słowem przyjemny design. Początkującym bardzo łatwo będzie zrozumieć interfejs Copernic Desktop Search. Choć nieco zawstydzające jest to, że projektanci wyraźnie stworzyli interfejs programu, biorąc pod uwagę, że program będzie działał w standardowym motywie Windows XP. Przy zastosowaniu klasycznego motywu program nie wygląda już tak ładnie. Ale to bardziej kwestia gustu.

Przy pierwszym uruchomieniu program oferuje utworzenie indeksów do wyszukiwania. Dość nietypowe wydawało się, że po wybraniu folderów do indeksowania program nie proponuje naciśnięcia żadnego przycisku, np. „Rozpocznij indeksowanie”, a indeksowanie nie uruchamia się automatycznie, dopiero wtedy zauważono, że Copernic próbował rozpocząć indeksowanie, gdy komputer był bezczynny. Będziesz musiał trochę zagłębić się w opcje programu, aby wszystko poprawnie skonfigurować. Należy zauważyć, że istnieją dość szerokie możliwości ustawienia automatycznego tworzenia indeksów: wbudowany harmonogram, możliwość indeksowania podczas bezczynności komputera, w tle, z niskim priorytetem. Indeksowanie nie było zbyt szybkie - 10 godzin i 51 minut - to wolniej niż w innych wyszukiwarkach (poza Snooperem, Copernic jest wciąż o rząd wielkości szybszy niż rozwój iSleuthHound Technologies.

Teraz o strukturze indeksu. Ogólnie nie ma w tym nic specjalnego. Istnieje wybór typów plików, zarówno w formie uogólnionej, jak i szczegółowej. Oznacza to, że początkowo możesz wybrać, co chcesz zindeksować - dokumenty, obrazy, filmy, muzykę. Na drugiej karcie okna opcji będzie można wybrać określone typy plików według rozszerzenia. Ponadto można skonfigurować indeks tak, aby na przykład obrazy mniejsze niż 16x16 nie były indeksowane lub pliki dźwiękowe krótsze niż 10 sekund nie były indeksowane. Oprócz indeksowania plików z folderów, Copernic może pracować z e-mailami i kontaktami z książki adresowej Microsoft Outlook i Microsoft Outlook Express, możliwe jest indeksowanie Ulubionych i Historii z Internet Explorera.

Możliwości wyszukiwania są tutaj słabe. Podczas testów ujawniono nawet, że program nie wyszukuje dokumentów w formatach txt i html w języku rosyjskim, pozwalając znaleźć je tylko po nagłówkach, a bynajmniej nie po treści. Jedyne, co zapewnia program, aby poprawić wydajność wyszukiwania, to użycie zestaw standardowy operacje logiczne, a nawet wtedy możliwość tę odkryto eksperymentalnie, ponieważ nie została udokumentowana. Nawiasem mówiąc, pomoc programu również nie jest w porządku - jest dostępna tylko przez Internet, co, jak widzisz, jest bardzo niewygodne, aw sieci nie ma zbyt wielu informacji pomocniczych. Najwyraźniej programiści zdecydowali, że prosty interfejs programu nie oznacza obecności normalnej pomocy. Kontynuując rozmowę o możliwościach wyszukiwania należy zaznaczyć, że mimo słabej analizy zapytań program zapewnia ciekawy system wyszukiwania - użytkownik może wybrać rodzaj plików (zdjęcia, filmy, muzyka itp.), Wejść w wyszukiwanie zapytaj i wybierz atrybuty właściwe dla wybranego typu pliku. Na przykład dla plików dźwiękowych mogą to być wartości z tagów mp3 (wykonawca, album, data itp.), Dla obrazów, na przykład, możesz wybrać ich rozmiar (według rozdzielczości), ogólnie każdy typ ma swój własne ustawienia. Po wyszukaniu określonego typu pliku, program wyświetli bardzo pouczającą listę w oknie wyników, a jeśli Twoje zapytanie zawiera pliki innego typu, możesz je otworzyć, klikając określony link.

Osobno warto wspomnieć o oknie wyświetlania wyników. Zawartość tych plików jest wyświetlana pod listą znalezionych plików (podobny schemat jest często używany w klientach pocztowych). To prawda, że \u200b\u200btekst można wyświetlać tylko w jego natywnym formacie i nie ma trybu wyświetlania zwykłego tekstu, co nie zawsze jest wygodne, ponieważ w tym przypadku otwarcie dokumentu zajmuje więcej czasu. Biorąc jednak pod uwagę, że Copernic może wyszukiwać obrazy i muzykę, możliwe jest przeglądanie tych plików multimedialnych.

Opisane są podstawowe zasady działania tego programu, teraz zobaczmy, co może nam zaoferować Copernic Desktop Search do pracy z siecią… W zasadzie możesz oglądać bardzo długo, ale prawie nic nie będziesz w stanie zobaczyć. Innymi słowy, ten program nie był przeznaczony do pracy w sieci. Copernic Desktop Search to wyłącznie wyszukiwarka domowa.

Oczywiście jedyną (najbardziej logiczną) aplikacją tego programu jest komputer domowy. Tutaj całkiem poradzi sobie ze wszystkimi prostymi zapytaniami użytkowników składającymi się z jednego lub dwóch słów, znajdzie potrzebne informacje oraz oddzielenie wyszukiwania według typu pliku i obsługę plików multimedialnych wraz z indeksowaniem w tle w trybie niskiego priorytetu, w połączeniu z przyjemnym interfejsem, dają programowi siłę tylko do zdobycia zaufania wśród niedoświadczonych użytkowników.

Oficjalna strona
Rozmiar dystrybucji: 2.6 MbISYS Desktop

Kliknij na zdjęcie, aby powiększyć

Bardzo potężny program. Pod względem poziomu wyposażenia z różnego rodzaju funkcjami jest gdzieś blisko kolejnej wyszukiwarki na liście SearchInform. Rozmiar pliku instalacyjnego przekracza 40 MB! Trudno powiedzieć, co zmieściłoby się w takich rozmiarach, ponieważ ten sam SearchInform, z podobną funkcjonalnością, zajmuje 15 MB.

Proces instalacji tutaj również nie jest zbyt przyjemny, a raczej nawet sam proces instalacji. Przed pobraniem programu zostaniesz poproszony o zarejestrowanie się, w przeciwnym razie nie. Dalej jest interfejs. Wykonany jest bardzo ładnie, nie rzuca się jednak w oczy nic zbędnego - takie są wrażenia osoby, która jest już do tego trochę przyzwyczajona. Początkującym nie będzie łatwo dowiedzieć się, gdzie i co się znajduje, gdzie kliknąć i gdzie ostatecznie szukać. Zdecydowanie zalecamy zapoznanie się z pomocą przed rozpoczęciem pracy - zaoszczędzisz dużo nerwów i czasu. Do wszystkiego innego dochodzi całkowity brak obsługi języka rosyjskiego w programie. Niedobrze. W dodatku okna tutaj nie są przeładowane kontrolkami, ale zapłaconą za to ceną była wielomodułowość i zastosowanie dodatkowych okien. Na przykład zapytania wyszukiwania są wprowadzane za pomocą uruchomienia jednego programu, a zarządzanie indeksem odbywa się za pomocą innego programu. Wyszukiwane hasła są również wprowadzane tutaj w oddzielnych, pojawiających się oknach. Co jest lepsze - zatłoczony interfejs lub wszechobecne wiele okien - trudno powiedzieć, raczej jest to kwestia gustu.

W zakresie tworzenia indeksów program udostępnia funkcje upraszczające proces ustawiania opcji dla nowego indeksu. Te możliwości obejmują kilka gotowe szablony tworzenie indeksów dla folderów „Moje dokumenty”, „Poczta”, „Poczta i dokumenty”, „Określony folder”, „Folder z wyborem typów plików” itp. Takie szablony upraszczają tworzenie indeksów na pierwszym etapie. Narzędzie do pracy z indeksami ma niezbyt dobry interfejs, który odstrasza pewną złożoność (jest to bardzo subiektywna ocena, szczerze mówiąc), jednak jeśli się na to spojrzy, daje wiele przydatnych opcji i generalnie nie jest to trudne używać go. ISYS Desktop może indeksować dane z różnych źródeł danych, a także zapewnia wiele elastycznych ustawień dla takiego indeksowania. Dodatkowe funkcje indeksowania obejmują: obsługę SQL, FTP, TRIM Context, WORLDOX 2002, skryptów. Podczas tworzenia indeksu, jeśli wybrałeś element „Folder z wyborem typów plików”, masz możliwość ręcznego wyboru typów plików do indeksowania (według rozszerzenia). Muszę powiedzieć, że obsługiwane typy plików to po prostu ogromna liczba, jednak nie można dodać własnego typu (rozszerzenia) do istniejącej listy. Możesz również zauważyć obecność planera indeksowania. ISYS Desktop zajęło 6 godzin i 13 minut, aby utworzyć indeks i przetworzyć 20 gigabajtów informacji, ostatecznie pokazując dobry czas i rozmiar utworzonego pliku - 7,9 GB.

Możliwości wyszukiwania tego programu są całkiem dobre. Ten używany w ISYS jest znacznie potężniejszy niż zwykłe wsparcie dla operacji logicznych. Spośród zaawansowanych funkcji wyszukiwania program oferuje użycie synonimów, filtr sortowania (według ścieżki, nazwy i daty utworzenia pliku). Zestaw operatorów logicznych jest nieco szerszy niż zestaw standardowy. Oprócz operacji logicznych program umożliwia pracę z wieloma innymi operatorami, które w zasadzie są w stanie zastąpić niektóre typy wyszukiwania, na przykład wyszukiwanie parsujące można zastąpić za pomocą specjalnych operatorów. Byłem bardzo zaskoczony, że w programie nie ma wyszukiwania wykorzystującego morfologię. Jest to poważne niedopatrzenie, ponieważ skuteczność wyszukiwania jest znacznie zwiększona dzięki zastosowaniu analizy morfologicznej. Ponadto nie ma listy znaczących słów, ale istnieje obszerna lista słów pozbawionych znaczenia. Ogłaszane są również funkcje wyszukiwania, takie jak „wyszukiwanie przybliżone” i „analiza heurystyczna”.

ISYS zapewnia do wyboru kilka typów zapytań wyszukiwania, a mianowicie typy - wizualne. Odbywa się to za pomocą różnych typów okien do wprowadzania zapytań wyszukiwania, jednak w rzeczywistości żadne okno nie pozwala na użycie technologii innych niż wymienione powyżej.

Wyniki wyszukiwania są bardzo pouczające, wyświetlane jako lista dokumentów posortowanych według trafności. Poniżej znajduje się podgląd wybranego dokumentu. W przeciwieństwie do Copernic Desktop Search, podgląd jest dostępny tylko w postaci zwykłego tekstu, nie było możliwe wyświetlanie dokumentów w ich natywnym formacie, czy to Word, Html czy PDF, chociaż nie jest to w zasadzie zbyt krytyczne. Program umożliwia podzielenie znalezionych dokumentów na grupy według określonych kryteriów (domyślnie są one podzielone według trafności). Możesz również przeglądać już znalezione dokumenty, wybierając oddzielne foldery (jest to wygodne, gdy wynikiem jest bardzo duża liczba dokumentów).

Zastosowanie programu w sieci korporacyjnej jest również bardzo uzasadnione, ponieważ daje dobre możliwości zorganizowania wyszukiwania sieciowego. System wyszukiwania opiera się na utworzeniu indeksu publicznego, który zawiera indeksowane dane z publicznych zasobów sieciowych.

W rzeczywistości program firmy ISYS jest godny uwagi, przynajmniej zapoznania się z nim. Ten program jest dojrzałym projektem z ogromna ilość funkcje (nie zawsze i nie każdemu oczywiście są potrzebne, ale jednak). Szanse na to, że program będzie miał pewne ulepszenia w zakresie przetwarzania zapytań wyszukiwania nie są znane, ale w tej chwili można go polecić do niemal uniwersalnego zastosowania. A biorąc pod uwagę, że nadal jest zbyt ciężki dla systemów domowych, głównymi miejscami jego instalacji są sieci korporacyjne.

Oficjalna strona:
Wielkość dystrybucji: 40 MbSearchInform

Kliknij na zdjęcie, aby powiększyć

Prawdopodobnie nie powinieneś od razu zaczynać od opisu interfejsu SearchInform. Najpierw opisz proces instalacji, a raczej jeden z jego szczegółów: nie możesz zainstalować programu bez połączenia z Internetem. Faktem jest, że przed pierwszym uruchomieniem program wymaga rejestracji użytkownika (bezpłatnej) i wysyła wszystkie wprowadzone dane na serwer. Podobno programiści musieli podjąć takie kroki w walce z piractwem, ale nie wpłynęło to pozytywnie na łatwość instalacji.

Interfejs programu jest wykonany zgodnie ze wszystkimi ogólnie przyjętymi zasadami, jednak na pierwszy rzut oka jest nieco uciążliwy. Korzystając z programu po raz pierwszy wydaje się, że jest to zbyt skomplikowane, czasami nie jest łatwo zapamiętać, w którym menu lub na której zakładce znajduje się żądana opcja, jednak przy dłuższym użytkowaniu interfejs nie wydaje się już tak strasznie skomplikowany . Najważniejsze jest, aby najpierw przeczytać pomoc.

Przy odrobinie zrozumienia interfejsu możesz rozpocząć tworzenie indeksu. Sam proces jest bardzo prosty, a szybkość indeksowania, nawet na oko, jest znacznie wyższa niż w przypadku wszystkich innych wyszukiwarek z recenzji. Wyraźne wyniki testów porównawczych pokazują, że SearchInform dwukrotnie przewyższył dtSearch i iSYS pod względem szybkości indeksowania! Program zindeksował dostarczone dane w ilości 20 gigabajtów w rekordowym czasie - 3 godziny 17 minut. A rozmiar utworzonego indeksu okazał się najmniejszy 4,4 GB - 100 MB mniej niż w Google Desktop Search.

Program oprócz zwykłych plików i folderów obsługuje indeksowanie wiadomości e-mail, podłączanie i indeksowanie baz danych (!) Oraz innych źródeł zewnętrznych (DMS, CRM), od razu podczas indeksowania można określić słownik do wyszukiwania morfologicznego, a wszystkie atrybuty mogą być plikami indeksowanymi. Po utworzeniu indeksu, próbując przeprowadzić pierwsze testowe wyszukiwanie dokumentów, możesz się trochę pogubić: „są dwa rodzaje wyszukiwania, ale który z nich jest mi potrzebny?”. Jak wspomniano wcześniej - najważniejsze jest przeczytanie pomocy, wtedy wszystko stanie się jasne. Program jest naprawdę w stanie przeprowadzić dwa rodzaje wyszukiwania - jest to wyszukiwanie frazowe oraz wyszukiwanie dokumentów o treści zbliżonej do tekstu zapytania.

Opis wszystkich głównych funkcji analizy zapytania wyszukiwania został podany powyżej, więc teraz wymienimy tylko możliwości wyszukiwania oferowane przez ten program. Zacznijmy od wyszukiwania frazowego: oczywiście wyszukiwanie morfologiczne, wyszukiwanie cytowań, operacje logiczne, wyszukiwanie z parsowaniem słowa (wyszukiwanie na początku słowa, na końcu, w środkowej części lub w pełnym dopasowaniu), cytat mieszany wyszukiwanie (gdy wszystkie słowa z zapytania muszą znajdować się w dokumencie, ale niekoniecznie w podanej kolejności), wyszukiwanie z poprawieniem błędów, stosowanie synonimów, „wyszukiwanie prawie cytowania” (wyszukuje wpisaną frazę jako cytat, ale inne słowa mogą występować między wpisanymi słowami) itp. Niektóre z wymienionych opcji mają własne, specyficzne ustawienia. Dodatkowo istnieje możliwość skorzystania ze słownika nieistotnych słów, a program posiada już gotową listę tych słów, można też skorzystać ze słownika słów priorytetowych do wyszukiwania (oczywiście trzeba będzie go wypełnić siebie).

Tutaj w zasadzie omówiliśmy pokrótce wszystkie podstawowe możliwości wyszukiwania fraz.

Przejdźmy do rozważenia funkcji tego programu - poszukiwania podobnych dokumentów. Twórcy twierdzą, że nie jest to bynajmniej proste wyszukiwanie tekstu, to właśnie „poszukiwanie podobnego” - tak to jest przez nich wszędzie opisywane, ale ok, możesz to nazwać, jak chcesz - główny punkt. Krótkie wyszukiwanie w Internecie może szybko ujawnić, że tak zwane „wyszukiwanie podobne” jest nowym osiągnięciem w dziedzinie analizy tekstu. System ten umożliwia wyszukanie tekstów, które są podobne pod względem treści semantycznej. Najprzyjemniejsze było to, że po przeprowadzeniu poszukiwań testowych okazało się, że teoria to to samo, co praktyka! Program faktycznie wyszukuje dokumenty o podobnej treści i wyświetla je na liście, posortowanej według procentu podobieństwa.

Następnie przyjrzyjmy się, co oferuje SearchInform (w szczególności jego wersja korporacyjna SearchInform Corporate) do pracy w sieci firmowej. Istnieją dwa typy aplikacji: zaplecze i po stronie użytkownika. Strona serwera samodzielnie przetwarza określone indeksy, a użytkownicy mogą ich używać do wyszukiwania, w zależności od nadanych im praw dostępu. Użytkownicy mogą być konfigurowani automatycznie za pomocą konta Windows (w profesjonalnym języku, SearchInform używa uwierzytelniania Windows NTFS) lub ręcznie (użytkownicy będą musieli być dodani osobno). Każdemu użytkownikowi można zezwolić lub odmówić dostępu do określonych indeksów, można też łączyć użytkowników w grupy. Ogólnie rzecz biorąc, ustawienia sieciowe SearchInform wyprzedzają Google pod względem elastyczności, a Snoop Server pod względem wygody i prostoty.

Oficjalna strona:
Rozmiar dystrybucji: 14,7 Mb Porównanie szybkości indeksowania

WyszukiwarkaCzas indeksowaniaRozmiar indeksu
Snoop Prof Deluxe 4.5.0 Łatka38 godzin 46 minut19 GB
Isys Desktop 7.06 godzin 13 minut7,9 GB
DtSearch 7.06 godzin 3 minuty8,6 GB
Google Desktop Search Enterprise8 godzin 17 minut4,5 GB
Copernic Desktop Search *10 godzin 51 minut7 GB
SearchInform 1.5.023 godziny 17 minut4,4 GB

* Większość dokumentów .html i .txt zawierających tekst w języku rosyjskim, mimo że były indeksowane, ale poza nazwami nie można ich było znaleźć.

Wszystkie programy zasługują na uwagę.

Na podstawie testów i dokładnej analizy każdego programu przedstawionego w przeglądzie można wyciągnąć pewne wnioski. Tak więc Google Desktop Search Copernic Desktop Search jest całkiem odpowiedni dla niedoświadczonego użytkownika jako domowy system wyszukiwania informacji. Wykonują dobrą robotę z prostymi żądaniami, nie przeciążają użytkownika ustawieniami, a ponadto są całkowicie bezpłatne. Próba wejścia Google na rynek wyszukiwarek korporacyjnych nie jest jeszcze wysoce uzasadniona: do pełnoprawnej pracy program należy ważyć dodatkowe moduły, a ustawienie nie jest proste. Dlatego mówiący nazywają Desktop Search, że Copernic, że Google pozostawia za sobą niszę wyszukiwarek „desktopowych”.

Jednak mocniejsze rozwiązania - dtSearch, iSYS i SearchInform również nie są wypiekane i oferują użytkownikom ich wersje „desktopowe”. Ale za rozsądną cenę, w przeciwieństwie do bezpłatnego oprogramowania Google i Copernic. Oczywiście trzeba zapłacić za moc, szybkość i funkcjonalność. Ale głównym celem twórców dtSearch, iSYS i SearchInform jest oczywiście sektor korporacyjny. Sieć, funkcjonalność, szybkość indeksowania i wyszukiwania są tym, co odróżnia te produkty od ich „konkurentów”. Zgodnie z wynikami testu ustalono faworyta - SearchInform. Program zapewnia możliwość wyszukiwania podobnych dokumentów, ma najwyższą szybkość indeksowania i wyszukiwania, ma dobry zestaw funkcji.

PROFESJONALNE WYSZUKIWANIE INFORMACJI W INTERNECIE

Wyszukiwanie w Internecie jest ważnym elementem sieci. Mało kto zna dokładną liczbę zasobów sieciowych we współczesnym Internecie. W każdym razie rachunek idzie w miliardy. Aby móc w danym momencie wykorzystać potrzebne informacje, czy to w celach biznesowych, czy rozrywkowych, trzeba je najpierw znaleźć w tym nieustannie uzupełnianym oceanie zasobów.

Aby wyszukiwanie w Internecie zakończyło się sukcesem, muszą być spełnione dwa warunki: zapytania muszą być dobrze sformułowane i należy je zadawać w odpowiednich miejscach. Innymi słowy, od użytkownika wymagana jest z jednej strony umiejętność tłumaczenia swoich zainteresowań poszukiwawczych na język wyszukiwanego hasła, az drugiej dobra znajomość wyszukiwarek, dostępnych narzędzi wyszukiwania, ich zalet i wad , co pozwoli mu w każdym przypadku wybrać najbardziej odpowiednie środki wyszukiwania. ...

Obecnie nie ma jednego zasobu, który spełniałby wszystkie wymagania wyszukiwania w Internecie. Dlatego poważne podejście do wyszukiwania nieuchronnie wymaga użycia różnych narzędzi, używając każdego w najbardziej odpowiednim przypadku.

Główny narzędzia wyszukiwania internetowego można podzielić na następujące główne grupy:

Wyszukiwarki;

Katalogi internetowe;

Zasoby pomocy;

Lokalne programy do przeszukiwania Internetu.

Najpopularniejsze narzędzia wyszukiwania towyszukiwarki - tzw. wyszukiwarki internetowe (Search Engines). Trzej liderzy na świecie są dość stabilni - Google, Yahoo! i Bing. Wiele krajów dodaje do tej listy własne lokalne wyszukiwarki, zoptymalizowane pod kątem treści lokalnych. Z ich pomocą teoretycznie można znaleźć dowolne konkretne słowo na stronach wielu milionów witryn. Z punktu widzenia użytkownika główną wadą wyszukiwarek jest ich nieunikniona obecnośćszum informacyjny w wynikach. Dlatego zwyczajem jest wywoływanie wyników znajdujących się na liście wyszukiwania z tego czy innego powodu, które nie pasują do żądania.

Pomimo wielu różnic, wszystkie wyszukiwarki internetowe działają na podobnych zasadach iz technicznego punktu widzenia składają się z podobnych podsystemów. Pierwszą częścią strukturalną wyszukiwarki są specjalne programy służące do automatycznego wyszukiwania i późniejszego indeksowania stron internetowych. Takie programy są powszechnie nazywane pająkami lub botami. Skanują kod stron internetowych, znajdują linki na nich, a tym samym odkrywają nowe strony internetowe. Istnieje również alternatywny sposób umieszczania witryny w indeksie. Wiele wyszukiwarek oferuje właścicielom zasobów możliwość samodzielnego dodania witryny do bazy danych. Tak czy inaczej, strony internetowe są pobierane, analizowane i indeksowane. Podkreślane są w nich elementy strukturalne, wyszukiwane są słowa kluczowe, ustalane są ich linki do innych witryn i stron internetowych. Wykonywane są również inne operacje, których efektem jest utworzenie bazy indeksowej wyszukiwarki. Ta baza jest drugim głównym elementem każdej wyszukiwarki. Obecnie nie ma jednej absolutnie pełnej bazy indeksów, która zawierałaby informacje o całej zawartości Internetu. Ponieważ różne wyszukiwarki używają różnych programów do wyszukiwania stron internetowych i budują swój indeks przy użyciu różnych algorytmów, bazy indeksów wyszukiwarek mogą się znacznie różnić. Niektóre witryny są indeksowane przez kilka wyszukiwarek, ale zawsze pewien procent zasobów jest uwzględniony w bazie tylko jednej wyszukiwarki. Fakt, że każda wyszukiwarka posiada tak oryginalną i nie zachodzącą na siebie część indeksu pozwala na wyciągnięcie ważnego praktycznego wniosku: korzystając tylko z jednej wyszukiwarki, nawet największej, na pewno stracisz pewien procent przydatnych linków.

Następną częścią wyszukiwarki internetowej są faktyczne programy do wyszukiwania i sortowania. Programy te rozwiązują dwa główne zadania: najpierw wyszukują w bazie danych strony i pliki, które odpowiadają otrzymanemu żądaniu, a następnie sortują wynikową tablicę danych według różnych kryteriów. Sukces w osiąganiu celów wyszukiwania zależy w dużej mierze od efektywności ich pracy.

Ostatnim elementem wyszukiwarki internetowej jest interfejs użytkownika... Oprócz zwykłych wymagań dotyczących estetyki i wygody każdej witryny, istnieje jeszcze jeden ważny wymóg dotyczący interfejsów wyszukiwarek: muszą one oferować różne narzędzia do tworzenia i udoskonalania zapytań, a także sortowania i filtrowania wyników. Atuty wyszukiwarek to doskonałe pokrycie źródeł, relatywnie szybka aktualizacja zawartości bazy danych oraz dobry wybór dodatkowych funkcji.

Głównym narzędziem pracy z wyszukiwarkami jest zapytanie.

Do wyszukiwania w Internecie używane są również specjalne aplikacje, które są instalowane na komputerze lokalnym. To może być jak proste programyoraz dość złożone kompleksy wyszukiwania i analizy danych. Najpopularniejsze wtyczki wyszukiwania dla przeglądarek, panele przeglądarki zaprojektowane do współpracy z określoną usługą wyszukiwania oraz pakiety metasearch z możliwością analizy wyników.

Katalogi internetowe - są to zasoby, w których serwisy podzielone są na kategorie tematyczne. Jeśli użytkownik pracuje z wyszukiwarkami tylko poprzez zapytania, wówczas katalog ma możliwość pełnego przeglądania sekcji tematycznych. Druga zasadnicza różnica między katalogami a automatycznymi wyszukiwarkami polega na tym, że z reguły w ich zawartość bezpośrednio angażują się ludzie, którzy przeglądają zasoby i odsyłają witrynę do jednej lub drugiej kategorii. Zwykle katalogi internetowe dzieli się na uniwersalne i tematyczne. Universal postaraj się poruszyć jak najwięcej tematów. Zawierają wszystko, od witryn poetyckich po zasoby komputerowe. Innymi słowy, mają maksymalną szerokość wyszukiwania. Z drugiej strony katalogi tematyczne specjalizują się w określonym temacie, zapewniając maksymalną głębokość wyszukiwania poprzez zmniejszenie zakresu zasobów.

Zaletą katalogów jest stosunkowo wysoka jakość zasobów, ponieważ każda zawarta w nich witryna jest przeglądana i wybierana przez osobę. Tematyczne grupowanie witryn umożliwia wygodne układanie witryn z pokrewnymi tematami. Ten tryb działania jest dobry do odkrywania dla Ciebie nowych witryn na interesujący Cię temat - jest dokładniejszy niż korzystanie z wyszukiwarki. Zaleca się korzystanie z katalogów internetowych do pierwszego zapoznania się z jakimkolwiek obszarem tematycznym, a także do wyszukiwania niejasnych zapytań - będziesz miał możliwość „wędrować” po sekcjach katalogu i dokładniej określić, czego dokładnie potrzebujesz.

Wady katalogów internetowych są dobrze znane. Przede wszystkim jest to powolne uzupełnianie bazy danych, ponieważ włączenie witryny do katalogu wymaga udziału człowieka. Pod względem wydajności katalog stron internetowych nie jest konkurentem dla wyszukiwarek. Ponadto katalogi internetowe są znacznie gorsze od wyszukiwarek pod względem rozmiarów baz danych.

Mówiąc o wyszukiwaniu w Internecie, nie można pominąć szeregu terminów, które są ściśle związane z tym obszarem i są często używane do opisu i oceny wyszukiwarek. Na przykład:szerokość i głębokość wyszukiwarka internetowa. Wyszukiwanie szerokie nazywa się wyszukiwaniem, które obejmuje jak najwięcej źródeł informacji. W takim przypadku przynajmniej wzmianka o konkretnym żądaniu witryny jest uważana za wystarczającą. Głębokość wyszukiwania odnosi się do szczegółów indeksowania i późniejszego wyszukiwania każdego określonego zasobu. Na przykład wiele wyszukiwarek stosuje różne podejścia do indeksowania różnych witryn. Duże i popularne strony są indeksowane w maksymalnym stopniu, roboty starają się nie przegapić ani jednej strony takiego zasobu. Jednocześnie w innych witrynach indeksowana może być tylko strona tytułowa i kilka stron z treścią. Okoliczności te oczywiście wpływają na późniejsze poszukiwania. Głębokie wyszukiwanie działa na zasadzie „lepiej jest zawrzeć w wynikach niepotrzebne informacje, niż pomijać jakiekolwiek istotne dane”.

Dość często można znaleźć takie pojęcia, jakglobalnie i lokalnie wyszukiwarka internetowa. Lokalne wyszukiwania internetowe uwzględniają lokalizację geograficzną użytkownika i preferują wyniki, które są w jakiś sposób związane z określonym krajem lub obszarem. Gdy wyszukiwanie globalne ta informacja jest ignorowana i przeszukiwane są wszystkie dostępne zasoby.

Podczas tworzenia zapytania w wyszukiwarkach internetowych działają różne tryby wyszukiwania. Typowe tryby wyszukiwania, które można znaleźć na większości komputerów internetowych, obejmująproste i zaawansowane Szukaj. Wyszukiwanie proste umożliwia określenie tylko jednego wyszukiwanego terminu w jednym zapytaniu. Zaawansowane wyszukiwanie umożliwia utworzenie zapytania z kilku warunków, łącząc je za pomocą operatorów logicznych.

Aby zawęzić zapytania wyszukiwania, różnefiltry ... Filtry to te lub inne pomoce przy tworzeniu zapytań, które nie odnoszą się do strony treści warunków zapytania, ale ograniczają wyniki wyszukiwania do jakiejś formalnej funkcji. Na przykład, stosując filtr typu pliku podczas wyszukiwania, użytkownik nie przekazuje systemowi informacji związanych z tematem jego żądania, ale po prostu ogranicza uzyskane wyniki do określonego typu pliku określonego w warunku jego żądania.

Dla większości użytkowników uniwersalne wyszukiwarki są głównym i często jedynym sposobem wyszukiwania w Internecie. Zapewniają dobre pokrycie źródeł, a także zestaw narzędzi wystarczających do podstawowych zadań wyszukiwania.

Rynek uniwersalnych wyszukiwarek jest wystarczająco duży. Podjęliśmy próbę analizy najbardziej znanych wyszukiwarek, a wyniki przedstawiliśmy w postaci tabeli 1.

Przy wyborze uniwersalnej wyszukiwarki istotną rolę odgrywa jakość znalezionych za jej pomocą zasobów. Możesz określić preferowaną wyszukiwarkę dla określonych zadań za pomocą „metody znaczników”. Jej istota polega na tym, że najpierw powstaje pewne tematyczne zapytanie wyszukiwania, po którym przesłuchuje się grupę osób - ekspertów w tej dziedzinie w celu zidentyfikowania najlepszych ich zdaniem zasobów internetowych na wybrany temat. Na podstawie danych z ankiety tworzona jest lista znaczników, które z pewnością odpowiadają żądaniu i zawierają informacje wysokiej jakości. Następnie żądanie wysyłane jest do testowanych wyszukiwarek. Logika oceny jest prosta: im wyżej w wynikach wyszukiwania znajdują się znaczniki, tym lepiej dany zasób nadaje się do znajdowania informacji na temat testu.