Информационные ресурсы Интернет
Поисковая система WAIS
WAIS - еще один сервис Интернет, сегодня почти не использующийся, или, по крайней мере, практически не развивающийся. WAIS расшифровывается как информационная система широкого профиля, но на самом деле это комплекс программ, предназначенных для индексирования больших объемов неструктурированной, как правило просто текстовой, информации, поиска по таким документам и их извлечения. Существуют программы для индексирования, для локального поиска по полученным индексам, а также серверная и клиентская программа, общающиеся между собой по специальному протоколу Z39.50. Задача поиска по большим объемам неструктурированной информации весьма нетривиальна и сегодня еще не существует общепринятого ее решения. WAIS во многих случаях является приемлемым вариантом поисковой системы, и коль скоро она имеет свободно распространяемую программную реализацию, то получила достаточную известность как один из сервисов Интернет. На самом деле, она почти не используется сегодня самостоятельно, но во многих случаях применяется как вспомогательное средство, например, для индексирования документов, хранящихся на WWW-сервере. В некоторых случаях она также используется как средство работы со словарями, или для поиска по архивам сетевых новостей Usenet. Если перед Вами стоит задача по индексированию больших объемов неструктурированной информации, то, возможно, WAIS окажется адекватным ее решением. Однако, нужно иметь в виду, что свободно распространяемая реализация системы далека от совершенства, что система достаточна сложна для понимания и изучения, и, что хуже всего, практически не развивается. Поддержкой и развитием свободной версии занимались последовательно несколько организаций, но ни одна из них не довела продукт до приемлемого для реальной работы состояния.
"Навигация" в сети Internet
При обширном информационном богатстве, которое возникало в каждом "углу" InterNet, подобно грибам на лесной поляне, главным требованием к новым инструментальным средствам была эффективность при поиске требуемых сетевых ресурсов.
Ввиду большого многообразия имеющихся ресурсов в сети InterNet, информационный поиск - сложная проблема, особенно с точностью до абсолютного сетевого номера (для примера, имеются сотни сложных баз данных, и десятки тысяч архивных серверов со свободным доступом). Фактически каждый час в сети появляются все новые и новые источники, что и делает обычный поиск практически безнадежным занятием. В настоящее время имеются следующие "навигационные" средства:
- система Archie;
- СУБД для поиска файлов в открытых для доступа архивах;
- Wide Area Information Server, который может использоваться для поиска в большом числе баз данных и документальных архивах.
Имеется также системы типа Gopher с интерфейсом в виде текстовых экранных форм-меню, которые ссылаются на распределенные по сети информационные источники, образуя тем самым "паутину" связей - так называемые Gopher-пространства. Система Veronica предназначена для поиска объектов в этом Gopher-пространстве.
Эти навигационные "прилады" (средства) до сих пор широко используются.
Но, обеспечивая эффективную навигацию по InterNet, они все имеют дело с простым форматом командного файла и манипулируют с ограниченным типом данных.
Стало ясно, что необходимы более совершенные системы с развитыми сервисными функциями и с возможностями обработки более разнообразных
форматов данных. И одним из источников разнообразных данных стала сама Web-сеть, послужившая основой для следующего поколения инструментальных средств InterNet - Web-"навигаторов.
Модификация Web
Гипертекстовые ссылки системы Web действуют как указатели на другие части единого документа, или на совершенно разные документы, или на другие доступные по сети сервисы. Хотя во многом это кажется несколько абстрактным в теории, на практике - очень эффективно и удобно.
Если Вы когда-либо использовали подсистему Help для Windows, Вы уже имели практические навыки работы с гипертекстом. Любое слово, фраза, или пиктограмма в документе "Help" может быть описана как самостоятельный объект. Когда Вы выбираете этот объект, происходит переход на соответствующую часть документа.
Навигаторы Web расширяют эту идею, обеспечивая связи между документами, размещенными в разных узлах сети, и доступ к разнообразным сервисам типа FTP и Gopher-пространствам.
Для примера, в описании сетей может быть ссылка на Ethernet. Если слово "Ethernet" поддержано гипертекстовой ссылкой, при его выборе, Вы получите переход на описание этой сетевой технологии. В этом описании, в свою очередь, может быть ссылка на документ о поставщиках оборудования Ethernet и выбор какого-то из них обеспечит переход на документ, описывающий все поставляемое им оборудование. Более того, в этом описании может быть список всех драйверов для поставляемых адаптеров сети Ethernet.
О! и Вы обнаружили, что появилась самая последняя версия драйвера именно для той карты, которую Вы уже давно используете. И эту версию можно заполучить простым нажатием клавиши Вашей "мышки" для активации соответствующей гипертекстовой ссылки.
Ссылки и документы
Документы в системе Web могут включать, помимо текстов, указания об используемых шрифтах и форматах, ссылки на графические данные и фотоснимки, ссылки на другие данные, документы и сервисы. Все эти документы формируются по правилам Hypertext Markup Language (HTML).
HTML базируется на промышленном стандарте - Standard General Markup Language (SGML) - для создания машинно-независимых документов, с учетом всего многообразия используемых компьютерных платформ. При этом HTML еще более расширяет определение гипертекстовой ссылки.
HTML документ состоит из текста, который должен быть выдан на дисплей, и описателей - тэгов (tags), которые определяют, как этот техт должен быть представлен, и как другие типы данных - для примера, видео- и аудио- данные - должны извлекаться и форматироваться, и куда ведет каждая гипертекстовая ссылка.
HTML-описатели являются полями в документе, которые размещаются между символами "" и содержат директивы и соответствующие параметрические данные - атрибуты директивы.
Например, в поле <H1> Hello HTML </H1> начальный тэг <H1>указывает на начало заголовка, а директива "H" определяет, что следующий за этим тэгом текст следует разместить в этом заголовке. Следующие за директивой атрибуты доопределяют, что эта директива должна фактически сделать. В нашем примере аргумент "1" указывает, что заголовок должен размещаться на первом уровне. Завершающий тэг </H1>указывает об окончании этого поля.
Имеются специальные тэги для описания гипертекстовых ссылок (так называемых anchors), заголовков, изображений и других объектов.
Создание HTML-документов - занятие не для "слабаков".