GetInfo.Ru – Компьютерная библиотека
Последние поступления
Как выбрать систему управления базы данных
Базы данных03/09/14
Этапы загрузки UNIX (в схеме)
Unix27/03/12
Gatewall Antispam: тотальный контроль электронной почты
Спам21/04/11
Мастер-класс: создаем Интернет-магазин (Часть 1)
Обзоры ПО20/04/11
CorelDRAW Graphics Suite X5: Что нового?
Обзоры ПО20/07/10
Добавить статью
Самые читаемые материалы
Краткий обзор бесплатных "движков" (CMS) для сайта(26876)
Бизнес-планирование для Интернет-проекта(20709)
Обзор решений для тестирования сайтов(18709)
Составление сметы на сайт(17923)
Конструкторы сайтов: дешево и сердито(11062)
Всего статей: 793Всего авторов: 364Подразделов: 47Добавлено за сутки: 0
Статьи  СТАТЬИ Форум  ФОРУМ Рейтинг  РЕЙТИНГ Поиск  ПОИСК Контакты  КОНТАКТЫ
» Главная » Управление проектами » Ищи и дай искать другим!

Ищи и дай искать другим!


Дмитрий Прянишников
online@hardnsoft.ru
http://www.hardnsoft.ru/

Система навигации на сайте может быть хорошо продумана и удобна. Однако когда объем информации на ресурсе переваливает за несколько десятков страниц, львиная доля его посетителей не находит необходимого. В результате ресурс теряет свое основное предназначение — информировать или развлекать посетителя. Эта проблема решается использованием системы поиска по сайту.

Такое решение, как разработка собственных модулей для поиска информации на сайте, подходит далеко не всегда — это нетривиальная задача, решить которую может далеко не каждый владелец странички, особенно если он плохо знаком с программированием. К тому же созданные скрипты не всегда подходят для бесплатных хостинг-площадок, на которых чаще всего размещаются персональные странички (пусть даже и неплохо раскрученные).

Можно воспользоваться и готовыми скриптами, благо что их существует немало — как бесплатных, так и коммерческих. Но и они выручают не всегда. Во-первых, они сложны в работе, и для работы с ними, как правило, требуются знания о программировании и администрировании Web-серверов. Во-вторых, повторюсь, при размещении сайтов на бесплатных хостингах использовать эти скрипты, как правило, невозможно. А штатные «искалки» на этих серверах работают чаще всего плохо. Но не все так плохо, выход есть — нужно воспользоваться существующими поисковыми машинами. Они предоставляют удобные сервисы, связанные с поиском на ваших персональных страничках.

Самый простой метод поиска заключается в отправке комбинированного запроса (так, чтобы в него включались термины, которые явно указывают на ваш сайт) на одну из проиндексировавших его поисковую систему. Он, впрочем, не всегда эффективен, поскольку сайты индексируются поисковыми сервисами нечасто, а небольшие домашние странички и подавно. Вполне может быть, что вы уже обновили, дополнили и расширили представленную на сайте информацию, а поисковые службы возвращают устаревшие ссылки. Поэтому можно применить иной метод — установку на сайт предоставляемых крупными поисковыми ресурсами скриптов. На мой взгляд, это решение — наилучшее.

В русскоязычном Интернете для установки поисковых модулей на сайт можно использовать «Яndex» (раздел — www.yandex.ru/info/addyandex.html) или Google (раздел — www.google.com/services/free.html). На этих поисковиках можно получить JavaScript-модуль, с помощью которого и выполняется поиск. Как правило, он представляет собой небольшую Web-форму, состоящую из поля ввода и кнопки для передачи запроса на поисковый сервер. При нажатии на кнопку «Поиск» появляется окно с результатами поиска — в нем выводятся заголовки страниц, ссылки, а также небольшие фрагменты искомых документов.

Как вы уже, надеюсь, поняли, поисковые функции «Яndex» и Google практически одинаковы. Иное дело — предоставляемые поисковиками средства для настройки т.н. поискового отчета. В Google предусмотрено очень небольшое число настроек внешнего вида страницы с результатами поиска. К примеру, можно разместить в шапке логотип своего сайта. В свою очередь, «Яndex» позволяет устанавливать на сайтах свои формы, а также предлагает всем желающим серверную программу «Яndex.Site» для поиска слов с учетом морфологии, бесплатная версия которой индексирует около 5 Мбайт текста.

Персонализируемые поисковики
Есть и другой способ поиска — использование специальных поисковых сервисов, которые индексируют не все сайты в Сети, а только те, на которые устанавливаются соответствующие модули (JavaScript-сценарии). Такие сервисы я буду называть персонализируемыми. Они позволяют гибко настраивать внешний вид странички с результатами поиска, а также настроить алгоритм.

В русскоязычном Интернете таких сервисов, увы, нет. Впрочем, многие англоязычные ресурсы поддерживают кириллицу, так что и российский пользователь может приобщиться к их «благам». Если ваш сайт содержит менее 500 страниц, вы сможете пользоваться персонализируемыми поисковиками бесплатно. Для организации поиска на более крупных ресурсах уже придется платить — на соответствующих Web-сервисах можно выбрать различные тарифные планы.

Freefind.com
На мой взгляд, лучшим из персонализируемых поисковых сервисов является Freefind.com (www.freefind.com). Его бесплатная версия позволяет индексировать до 32 Мбайт HTML-кода и не имеет ограничения по количеству страниц. При регистрации вам нужно лишь ввести адреса сайта и электронной почты. Через несколько минут в указанный почтовый ящик «упадет» письмо с данными для доступа к администрированию нового аккаунта.

Последовательность действий при настройке Freefind несложная — она выполняется в Web-интерфейсе администратора. Итак, сначала вам нужно индексировать сайт. Для этого на вкладке Build Index нажмите на Index now. На эту операцию у сервера уходит от нескольких минут до нескольких часов, в зависимости от размера вашего ресурса. Обрабатываются даже динамические документы со сложными адресами, главное, чтобы до них можно было добраться по цепочке ссылок с главной страницы.

На следующем шаге на вкладке Build Index администратора задайте периодичность индексирования сайта и адреса страниц, которые не нужно включать в индекс (например, первую страницу сайта или всплывающие окна с рекламой). Если вы часто обновляете свой сайт — смело назначайте переиндексацию раз в неделю (замечу, что это минимальный период для бесплатного сервиса Freefind) в удобные для вас день и время. Однако если страницы вашего сайта находятся на нескольких серверах с различными доменными именами, то вы можете задать точки входа робота на каждый из них, нажав на Set starting points.

После того как вы получите подтверждение индексации по почте, можно устанавливать на сайте одну из форм поиска, приведенных на вкладке HTML администратора. Удалять ссылки на сервер Freefind не стоит — не за этим они были поставлены. Хотя если вы самую малость подредактируете код формы, то она лучше будет смотреться на вашем сайте — это вряд ли обидит владельцев сервера. К примеру, измените длину поля для ввода запроса, надпись на кнопке с Search на «Найти» или сконфигурируйте скрипт таким образом, чтобы всегда открывалось новое окно с результатами поиска.

Владельцы сервера Freefind предусмотрели два способа настройки внешнего вида страниц с результатами поиска. Первый из них — задание отступов, фона и других составляющих внешнего вида страницы при помощи полей Web-формы. Такая возможность — это проявление заботы о пользователях, не слишком хорошо разбирающихся в тонкостях HTML, хотя форму поиска на страницы сайта все равно придется устанавливать вручную. Так что лучше сразу вооружиться справочником и, как говорится, делать все по уму — самостоятельно готовить шаблон для страницы с результатами поиска. К примеру, у меня на эту операцию ушло около часа.

Поиск с учетом морфологии в Freefind не производится, но, замечу, что на результативности это почти не сказывается. Запрашиваемые слова чаще всего вводятся в именительном падеже единственного числа. Они и встречаются во всех искомых документах.

Большим и, пожалуй, единственным минусом бесплатной версии Freefind.com является банер, размещаемый в окне над результатами поиска. Если вы увлечетесь созданием красивого логотипа для страницы с результатами поиска, то сами результаты съедут вниз. При экранном разрешении менее 1024x728 до первого из них придется добираться при помощи полосы прокрутки. Но это, право, мелочи.

Picosearch.com
Web-сервер позволяет искать на сайтах, число страниц которых не превышает 1500. Регистрация и первичная настройка в Picosearch (www.picosearch.com) принципиально ничем не отличаются от аналогичных процедур для Freefind, поэтому я не буду останавливаеться на ней подробно.

Этот поисковик отличается большим числом опций. Можно не только создавать индекс (и, соответственно, организовывать поиск) по нескольким сайтам, но и исключать страницы и пути из индекса. Перед индексацией указывается, на какие ссылки следует обращать внимание: в папках как в рамках одного сервера (актуально для доменных имен третьего уровня), так и в рамках доменного имени второго уровня.

На страничке с результатами поиска выводится небольшой банер, располагающийся рядом со строкой запроса. Замечу, что Freefind в этом отношении гораздо скромнее и позволяет использовать формы с малозаметными текстовыми ссылками на первоисточник. Впрочем, в Picosearch нет богато оформленной шапки. И это большой плюс.

Есть в Picosearch и недостатки. Так, из окна администратора в разделе Configure Results можно включить опцию Apply Stemming when searching. Смысл ее заключается в том, что по запросу search можно найти страницы, содержащие слова searched, searches и др. Предусмотрена эта функция для большинства европейских языков, но, увы, не для русского. В результате происходят всякого рода недоразумения. Скажем, по запросу «оценка» выводятся ссылки на страницы со словами «помещение» и «хранение» — поисковик выделяет «ключевые» буквенные сочетания «ен», но делает это неверно в принципе.

Второй существенный недостаток Picosearch — это категорическое нежелание отображать символы кириллицы в заголовках документов. Все вышеперечисленное вдвойне обидно в свете того, что в этом поисковике есть все необходимые средства для работы с русскоязычными документами. Сделать страницу с результатами поиска вписывающейся в концепцию сайта у вас также вряд ли получится, так как в свободном доступе в Picosearch есть только базовые настройки ее внешнего вида — можно выбрать логотип, изменить отступы и т.п.

Fusionbot.com
Регистрация на этом сервере выполняется несколько сложнее, чем на двух предыдущих, хотя немного терпения, и этот орешек вам поддастся. На все про все уходит примерно 5 минут. Индексирование сайта в поисковике происходит очень быстро при регистрации.

Если вы используете Fusionbot.com (www.fusionbot.com) бесплатно, вам придется смириться с несколькими ложками дегтя, в частности, переиндексацию сайта можно делать не чаще раза в месяц, а максимальное количество страниц, которые можно проиндексировать, составляет 250. Так же как в Picosearch, в Fusionbot предусмотрено 3 варианта следования по ссылкам с первой страницы сайта.

Установка формы поиска на страницы своего сайта также не составит для вас большой проблемы. Для этого зайдите в меню User info --> Get html code. Кстати, Fusionbot — единственный из рассмотренных персонализируемых поисковиков, не отображающий в Web-форме посторонние банеры или подписи. Вместо готовых шаблонов форм в PicoSearch есть несложный конструктор, при помощи которого вы можете сами создать форму для вашего сайта.

Настройка дизайна страницы с результатами поиска реализована не слишком хорошо. В дополнение к шаблонам дизайна (если так можно назвать несколько одинаковых форм с различными оттенками) совсем несложно изменять фон, логотип и подобные мелочи вручную. «Апогеем» всего этого безобразия является возможность добавить на страницу с результатами поиска логотип вашей компании или сайта, хотя это не спасает от ужасного вида странички.

В том, что касается поддержки русского языка, Fusionbot зарекомендовал себя неплохо. После установки языка и кодировки в пункте меню Customization --> Page display options на странице с результатами корректно отображаются заголовки страниц и фрагменты документов. Правда, указать русский язык в настройках не получится, там просто не предусмотрено такой функции, однако можно выбрать кодировку CP-1251.

Морфологический анализ в Fusionbot в общем-то есть, хотя он небесплатен. Впрочем, даже без него алгоритм Fusionbot работает на порядок лучше PicoSearch. Без проблем отыскиваются однокоренные слова и слова в различных падежных формах. Скажем, по запросу «склад» можно найти страницы, содержащие «склады», «складом», «складов» и т. д. Хотя перед более сложными случаями словообразования (скажем, когда при склонении или спряжении в слове появляются или меняются буквы) он оказывается бессильным.

Практические рекомендации искателям
Для реализации качественной системы поиска по сайту недостаточно просто зарегистрироваться на одном из вышеприведенных серверов, создать индекс и скорректировать внешний вид страницы с результатами поиска. Вы сами должны хорошо представлять себе то, что хочет найти посетитель. Для одного сайта важнее каталог товаров, для другого — какие-то отдельные статьи, для третьего — набор иллюстраций. В каждом из этих случаях, как правило, придется настраивать поисковик методом проб и ошибок.

Не могу не напомнить, что по прошествии некоторого времени после того, как заработает поиск на сайте, небесполезно познакомиться с отчетами поисковика — в нем представлены сведения о том, что посетители искали на вашем сайте. Проверьте, правильные ли результаты выдаются для наиболее популярных запросов. Если вы обнаружите явные несоответствия среди нескольких первых результатов, можно попробовать исключить полностью или частично искомое слово из страницы. В том же случае, если ошибочно найденная страница не несет полезной информации по другим ключевым словам, ее можно внести в список для исключения из индекса.

При помощи «Яndex» или Google вам вряд ли удастся реализовать качественный и отвечающий потребностям посетителей поиск по сайту. Дело не в том, что эти поисковики плохи, просто у них другая специализация и они неплохо с ней справляются. Сервер Freefind оказывается оптимальным решением для большинства сайтов. PicoSearch в бесплатной версии позволяет индексировать максимальное количество страниц, но это, пожалуй, единственное, что может быть причиной его использования. Нерусифицированный алгоритм Fusionbot, как ни странно, лучше других подойдет для сайтов, содержащих богатый и сложный текст. Ищите и дайте искать другим!

 
31.05.2003
Версия для печати Версия для печати Запомнить ссылку Запомнить ссылку
Ваша оценка:  1   2   3   4   5     

 О проектеПерепечаткаАвторамПартнерыО нас пишут
Наверх
©2003—2007. GETINFO.RU. ВСЕ ПРАВА ЗАЩИЩЕНЫ.