Краткий обзор основных поисковых систем и каталогов Рунета .

Поисковые системы

Яndex

В настоящее время - лучшая поисковая система России. На середину 2010 года декларирована индексация более 10 миллиардов оригинальных документов (страниц) с российских и зарубежных русскоязычных серверов, а также серверов на территории бывшего СССР. Обладает развернутой системой формирования запроса. Ввод поискового предписания осуществялется на естественном языке - все необходимые расширения производятся автоматически. Более детальный запрос может быть составлен с помощью режима "Расширенный поиск", в котором применяется система многоступенчатых меню. Яндекс - единственная российская поисковая система, индексирующая документы в форматах PDF, DOC, RTF, PPT, XLS и SWF. Показывает высокин результаты при поиске графических и видеофайлов. Обладает большим количеством сервисных функций. http://www.ya.ru.


Google

Локализованный российский вариант глобальной поисковой системы, которая на сегодня является абсолютным мировым лидером по объему проиндексированных документов (порядка 3 триллионов), быстроте обработки запроса и корректности ранжирования результатов поиска. Весь интерфейс выполнен на русском языке. Также является лучшей поисковой системой для выявления иллюстраций.


Bing

Русскоязычный вариант бета-версии поисковой системы, запущенной компанией Microsoft в середине 2009 года. Пока не обладает преимуществами, позволяющими ей опередить Google. Объем индексного файла в настоящее время сопоставим с аналогичными показателями Google, однако по всем остальным параметрам и, прежде всего, по степени определения релевантности результатов, Bing значительно уступает своему главному конкуренту. Система обладает всеми стандартными возможностями, включая поиск иллюстраций и видео-файлов.


Rambler

Является первой российской профессиональной поисковой системой, действующей с 1996 года. В конце 2002 года была произведена коренная модернизация, после которой Rambler вновь вошел в группу лидеров сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Для составления сложных запросов рекомендуется использовать режим "Детальный запрос", который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню. Интерфейс без рекламы расположен по адресу http://www.r0.ru.


ПОИСК@mail.ru

Поисковый модуль компании Mail.ru, запущенный в 2008 году. В качестве программного "движка" используется не собственная разработка компании, а поисковый модуль Google. Это обеспечивает данной поисковой системе высокие качественные характеристики. Сбор и индексирование информации осуществляется системой самостоятельно – этим определяются разные результаты запроса в Google и ПОИСК@mail. Форма "Расширенного поиска" также дает возможность ограничить разыскания определенными типами файлов (PDF, DOC, XLS, PPT), местом положения искомых слов в документе или определенным доменом.


Апорт!

В настоящее время система, разработанная во второй половине 1990-х годов, устарела по большинству показателей. Объем индекса системы ныне ориентировочно оценивается в 70 миллионов страниц. Ценность сохраняют лишь некоторые характеристики, в числе которых подсистема выдачи результатов: искомые слова показываются в контексте документа, что позволяет сразу же определить степень соответствия источника интересу пользователя. Имеются специальные режимы для поиска иллюстраций и аудио файлов. Стоит иметь ввиду, что "Апорт!" не ограничивает сферу деятельности только российскими или русскоязычными ресурсами: в его базе отражено большое число документов с зарубежных серверов. В "Апорт!" также включен справочник ресурсов Интернет, являющийся на данное время лучшим в России.


Nigma

Экспериментальный проект в области сетевого поиска (мета-поисковая система), в основе которого заложено применение искусственного интеллекта. Nigma в ряде случаев способна интуитивно предвидеть запрос и выдавать ответ без обращения к первоисточникам, решать формулы, расшифровывать сокращения, давать уточняющие подсказки при разысканиях на английском языке. Также осуществляется поиск иллюстраций и аудиофайлов.


Справочники

List.ru

Справочник, являющийся одним из факультатативных сервисов портала Mail.ru. Пополнение осуществляется на платной основе. В том числе и по данной причине справочник не отличается полнотой даже по невысоким российским меркам. Схема классификации изобилует множеством логических ошибок.


Улитка

В настоящее время насчитывает более 35.000 ссылок. Пополняется регулярно, но не слишком оперативно. Схема классификации разработана недостаточно. Источники не аннотируются, не редкость - ошибочное отнесение материалов к другим разделам. Технически система недостаточно отлажена, что иногда приводит к отказам в обслуживании при непосредственном обращении к ссылкам.


Каталог ресурсов "Забор""

Проект находится на начальном этапе развития. Отражено более 24.000 сайтов. Основной ряд классификации довольно подробный, однако, им и исчерпывается структура каталога. Внутри разделов перечислены сотни сайтов без какой-либо детализации.


Weblist

Отражаются не только российские серверы, но также и сайты ближнего зарубежья, в частности очень много украинских материалов. В нынешнем виде учитывается порядка 8000 источников, не считая раздела ТЕРРИТОРИИ, в котором, как правило, дублируются материалы из основного содержания. Источники проаннотированы, однако, чтобы ознакомиться с аннотацией, необходимо щелкнуть мышью по значку "up", находящемуся в конце ссылки. Некоторые ссылки даже на русскоязычные сайты приведены почему-то в английском переводе. Схема классификации, включающая ныне 14 основных разделов нуждается в серьезном улучшении.


Специализированные поисковые системы


SkreemR

Специализирующаяся на разыскании аудиофайлов поисковая система демонстрирует весьма высокое качество поиска, внушительный объем индексного файла и неплохую систему ранжирования результатов. К числу недостатков относится невозможность вести разыскания на иных языках, кроме английского и сверхназойливая реклама, пронизавшая весь интерфейс вцелом, включая каждую ссылку результатов поиска.

При формировании запроса с использованием Advanced Search допускается ограничение по элементу из описания аудиофайла (имя исполнителя, название альбома или композиции / речи), битрейту и длительности звучания. Эти параметры, а также данные о популярности файла среди пользователей SkreemR и его способность проигрываться её собственным плеером лежат в основе подсистемы ранжирования результатов. При наведении мыши на название найденного файла во всплывающем меню выдается его подробная характеристика. Клик по названию файла вызывает его воспроизведение с одновременным открытием страницы, с которой на него сделана ссылка.


FindSounds

Система, существующая с 2000 года, обеспечивает поиск расположенных на Интернет-серверах звуковых файлов в наиболее популярных форматах AIFF, Wave, MP3, AU. Формировать запросы можно только на английском языке. Особенностью FindSounds является ее способность обнаруживать образцы звучания различных музыкальных инструментов и звуковых эффектов, включая звуки живой природы. Именно с ее помощью легко обнаружить звуковые файлы с завыванием ветра, птичьими трелями, звуками флейты, или, к примеру, звуком парикмахерских ножниц. Каждый файл имеет краткое словесное описание, позволяющее точно определить его содержание.

При формировании запроса допускаются ограничения по формату, качеству звучания (битрейту), числу каналов (моно/стерео) и амплитуде (8/16 bit). В перечне результатов у каждой ссылки отображаются все характеристики найденного фрагмента, включая график, по которому можно визуально судить о качестве звука. Все найденные файлы могут быть немедленно прослушаны или отправлены по электронной почте.


Truveo

Запущенная в 2004 году поисковая система индексирует видеофайлы на наиболее насыщенных видеоконтентом Интернет-серверах. Имеется русскоязычная версия - ru.truveo.com, которая представляет возможность разысканий на профильных отечественных серверах, включая сайты ведущих телеканалов и самонаполняемые видеопорталы. Поиск осуществляется по ключевым словам из названия клипов. Перечень результатов выдается в виде ссылок, включающих название файла, его скриншут, указание на источник, на котором размещен файл, длительность воспроизведения и дату размещения. При клике на ссылку пользователь перенаправляется на страницу, содержащую исходный видеофрагмент.


Blinkx

Созданная в 2005 году поисковая система специализируется на поиске видеофайлов. В настоящее время декларируется учет более 18 миллионов видеосюжетов, размещенных на различных Интернет-серверах. Поисковая система сочетает возможности поиска по непосредственному содержанию видеофрагментов с традиционным поиском по ключевым словам из названия клипов. Обрабатывает запросы на различных языках, включая русский.

Подсистема Blinkx, обеспечивающая работу с результатами поиска, может служить образцовой для аналогичных поисковых инструментов. Найденные клипы представлены сменяющимися скриншутами, что позволяет составить достаточно полное представление обо всем содержании видеофрагмента. Обеспечиваются возможности воспроизведения начала фрагментов собственным плеером поисковой системы, формирования персонального списка видеофайлов, которые затем можно просмотреть один за другим или отправить на электронный адрес. В ссылке на видеофайл указаны сведения о его битрейте и продолжительность воспроизведения. Есть также опция безопасного поиска, исключающего появление в результатах видеофрагментов порнографического характера.


Digital Audio Search

Бета-версия поисковой системы, специализирующейся на поиске аудиофайлов. На сегодня время индексный файл системы невелик, к тому же она не может отрабатывать запросы на русском языке. Однако возможности составления запроса и работы с результатами заставляют относится к Digital Audio Search как к системе с большим потенциалом.



По материалам сайта : http://library.vadimstepanov.ru/