Форматы баз данных в автоматизированных библиографических системах
Рефераты >> Программирование и компьютеры >> Форматы баз данных в автоматизированных библиографических системах

ВВЕДЕНИЕ.

Термин MARC представляет собой акроним названия системы Machine- Readable Catalogue or Cataloguing (Машиночитаемый каталог или каталогизация). Однако это название не совсем точно, поскольку MARC не является ни каким-либо видом каталога, ни методом каталогизации. Фактически MARC- это краткий и удобный термин для обозначения процесса маркировки любой части каталогизационной записи так, чтобы она могла быть обработана с помощью компьютера.

В общих словах, коммуникативный формат MARC должен обеспечивать:

· возможность его применения для всех видов библиотечных документов;

· достаточную гибкость для решения разнообразных задач в дополнение к каталогизации;

· удобство применения в различных автоматизированных системах.

Применение стандарта MARC в библиотеке, которая до этого работала с каталожными карточками, заметно увеличит скорость работы, то есть не будет необходимости стоять "бог знает сколько времени" у каталога, чтобы найти нужную карточку. Стандарт MARC позволяет найти любую книгу, которая имеется в библиотеке, в считанные секунды. Например, если читатель забыл или не знает какого- либо нужного описания книги (автор, название и т. п) , то MARC даёт возможность найти эту книгу по ключевым словам. К достоинствам MARC-а следует отнести и то, что он требует минимум один компьютер, то есть все те каталоги с карточками становятся ненужными.

Использование стандарта MARC предотвращает дублирование работы и помогает библиотекам лучше распорядится библиотечными ресурсами. Выбор для работы формата MARC даёт библиотекам возможность приобретать надёжные каталогизационные данные, представленные в правильной форме.

Применение стандарта MARC при управлении библиотечными операциями позволяет библиотекарям использовать имеющиеся автоматизированные библиотечные системы. Многие системы, доступные библиотекам разного уровня, спроектированы для работы с форматом MARC. Они технически обслуживаются и совершенствуются, так что библиотеки могут пользоваться преимуществами последних достижений в компьютерной технологии. Стандарт MARC позволяет также библиотекам заменить одну систему на другую с уверенностью, что их данные будут совместимы.

Несмотря на сотрудничество стран в этой области появилось несколько версий формата MARC таких, как UKMARC, INTERMARC, USMARC, расхождения в которых были вызваны различиями в национальных правилах и практике каталогизации.

ГЛАВА 1.ОПИСАНИЕ ФОРМАТА USMARC.

Библиотека Конгресса является официальным депозитарием публикаций Соединённых Штатов и первичным источником каталогизационных записей для международных публикаций и публикаций США. В 1960-е гг. Библиотека Конгресса разработала формат MARC Библиотеки Конгресса (формат LC MARC), систему, использующую в каталогизационной записи цифры, буквы и другие символы для обозначения различных типов информации. В процессе развития формат LC MARC стал форматом USMARC (форматом MARC США). Ведение библиографического формата USMARC, также как и официальной документации USMARC, осуществляется Библиотекой Конгресса.

1.1 ТЕРМИНЫ USMARC И ИХ ОПРЕДЕЛЕНИЯ.

Указатели данных (Signposts): Чтобы считывать и интерпретировать библиографическую запись, компьютеру необходима помощь. Таблица 1 иллюстрирует информацию, для обозначения которой требуются "signposts".

Таблица 1

Запись с текстовыми "signposts": Та же запись с метками MARC:

"SIGNPOSTS"

ДАННЫЕ

"SIGNPOSTS"

ДАННЫЕ

Заголовок основной библиографической записи:

Имя:

King, Stephen

100 1 $а

King, Stephen

Заглавие и сведения об ответственности:

Основное заглавие:

Сведения об ответственности :

Misery

Jim Arnosky

245 10 $а

Misery

Jim Arnosky

Область издания:

Сведения об издании:

1 st ed.

250 $а

1 st ed.

и так далее .

Сравнение одной и той же записи с текстовыми "signposts" и с метками USMARC иллюстрирует компактность формата USMARC, то есть экономное расходование объёма компьютерной памяти.

Таблица 1 иллюстрирует запись MARC, размеченную "signposts". Наименованиями этих "signposts" являются: ПОЛЕ, МЕТКА, ИНДИКАТОР, ПОДПОЛЕ, КОД ПОДПОЛЯ И ОПРЕДЕЛИТЕЛЬ СОДЕРЖАНИЯ. Рассмотрим эти термины в отдельности.

Поле :Каждая библиографическая запись логически делится на поля. Имеется поле для автора, поле для информации о заглавии и т.д. Эти поля подразделяются на одно или несколько "подполей".

Как было отмечено ранее, текстовые наименования полей слишком длинные, чтобы их приводить в каждой записи USMARC. Вместо этого поля представляются 3-х цифровыми метками.

Метка :Каждое поле ассоциируется с трёхцифровым числом, которое называется меткой. Метка идентифицирует поле (тип данных), которое следует после неё. Даже если на экране дисплея сразу после метки выведены ещё и индикаторы (таким образом, может появиться число из 4 или 5 цифр), метка всегда представляет собой первые три цифры.

См. ниже пример записи поля. Число 100 является меткой, определяющей поле заголовка основной библиографической записи на имя лица (автора).

100 1# $a King, Stephen

В записи USMARC 10% меток используются достаточно, другие 90% встречаются только в редких случаях.

Индикаторы : За каждой меткой поля следуют две позиции символов (за исключением полей 001- 009). Одна или обе эти позиции символов могут использоваться для индикаторов. В некоторых полях применяется только первая или вторая позиция; в других полях используются обе позиции; а в таких полях, как 020 или 300, позиции не используются совсем. Если позиция индикатора не используется, индикатор характеризуется как "неопределённый", позиция остаётся незаполненной. В данной работе, в примерах, незаполненные или неопределённые позиции индикатора обозначаются символом " # ".

Значением каждого индикатора является цифра от 0 до 9. (Хотя правилами допускаются буквы, они используются редко). Даже, если два индикатора вместе могут казаться 2-х значным числом, в действительности они являются двумя отдельными цифрами. В приведённом ниже примере первые 3 цифры являются меткой (245 определяет поле заглавия), 2 следующие цифры (1 и 4) являются значениями индикаторов. "1"- первый индикатор; "4"- второй индикатор.

24514 $a The waste lands / $c adapted from Stephen King.


Страница: