Форматы баз данных в автоматизированных библиографических системахРефераты >> Программирование и компьютеры >> Форматы баз данных в автоматизированных библиографических системах
ВВЕДЕНИЕ.
Термин MARC представляет собой акроним названия системы Machine- Readable Catalogue or Cataloguing (Машиночитаемый каталог или каталогизация). Однако это название не совсем точно, поскольку MARC не является ни каким-либо видом каталога, ни методом каталогизации. Фактически MARC- это краткий и удобный термин для обозначения процесса маркировки любой части каталогизационной записи так, чтобы она могла быть обработана с помощью компьютера.
В общих словах, коммуникативный формат MARC должен обеспечивать:
· возможность его применения для всех видов библиотечных документов;
· достаточную гибкость для решения разнообразных задач в дополнение к каталогизации;
· удобство применения в различных автоматизированных системах.
Применение стандарта MARC в библиотеке, которая до этого работала с каталожными карточками, заметно увеличит скорость работы, то есть не будет необходимости стоять "бог знает сколько времени" у каталога, чтобы найти нужную карточку. Стандарт MARC позволяет найти любую книгу, которая имеется в библиотеке, в считанные секунды. Например, если читатель забыл или не знает какого- либо нужного описания книги (автор, название и т. п) , то MARC даёт возможность найти эту книгу по ключевым словам. К достоинствам MARC-а следует отнести и то, что он требует минимум один компьютер, то есть все те каталоги с карточками становятся ненужными.
Использование стандарта MARC предотвращает дублирование работы и помогает библиотекам лучше распорядится библиотечными ресурсами. Выбор для работы формата MARC даёт библиотекам возможность приобретать надёжные каталогизационные данные, представленные в правильной форме.
Применение стандарта MARC при управлении библиотечными операциями позволяет библиотекарям использовать имеющиеся автоматизированные библиотечные системы. Многие системы, доступные библиотекам разного уровня, спроектированы для работы с форматом MARC. Они технически обслуживаются и совершенствуются, так что библиотеки могут пользоваться преимуществами последних достижений в компьютерной технологии. Стандарт MARC позволяет также библиотекам заменить одну систему на другую с уверенностью, что их данные будут совместимы.
Несмотря на сотрудничество стран в этой области появилось несколько версий формата MARC таких, как UKMARC, INTERMARC, USMARC, расхождения в которых были вызваны различиями в национальных правилах и практике каталогизации.
ГЛАВА 1.ОПИСАНИЕ ФОРМАТА USMARC.
Библиотека Конгресса является официальным депозитарием публикаций Соединённых Штатов и первичным источником каталогизационных записей для международных публикаций и публикаций США. В 1960-е гг. Библиотека Конгресса разработала формат MARC Библиотеки Конгресса (формат LC MARC), систему, использующую в каталогизационной записи цифры, буквы и другие символы для обозначения различных типов информации. В процессе развития формат LC MARC стал форматом USMARC (форматом MARC США). Ведение библиографического формата USMARC, также как и официальной документации USMARC, осуществляется Библиотекой Конгресса.
1.1 ТЕРМИНЫ USMARC И ИХ ОПРЕДЕЛЕНИЯ.
Указатели данных (Signposts): Чтобы считывать и интерпретировать библиографическую запись, компьютеру необходима помощь. Таблица 1 иллюстрирует информацию, для обозначения которой требуются "signposts".
Таблица 1
Запись с текстовыми "signposts": Та же запись с метками MARC:
"SIGNPOSTS" |
ДАННЫЕ |
"SIGNPOSTS" |
ДАННЫЕ |
Заголовок основной библиографической записи: Имя: |
King, Stephen |
100 1 $а |
King, Stephen |
Заглавие и сведения об ответственности: Основное заглавие: Сведения об ответственности : |
Misery Jim Arnosky |
245 10 $а $с |
Misery Jim Arnosky |
Область издания: Сведения об издании: |
1 st ed. |
250 $а |
1 st ed. |
и так далее .
Сравнение одной и той же записи с текстовыми "signposts" и с метками USMARC иллюстрирует компактность формата USMARC, то есть экономное расходование объёма компьютерной памяти.
Таблица 1 иллюстрирует запись MARC, размеченную "signposts". Наименованиями этих "signposts" являются: ПОЛЕ, МЕТКА, ИНДИКАТОР, ПОДПОЛЕ, КОД ПОДПОЛЯ И ОПРЕДЕЛИТЕЛЬ СОДЕРЖАНИЯ. Рассмотрим эти термины в отдельности.
Поле :Каждая библиографическая запись логически делится на поля. Имеется поле для автора, поле для информации о заглавии и т.д. Эти поля подразделяются на одно или несколько "подполей".
Как было отмечено ранее, текстовые наименования полей слишком длинные, чтобы их приводить в каждой записи USMARC. Вместо этого поля представляются 3-х цифровыми метками.
Метка :Каждое поле ассоциируется с трёхцифровым числом, которое называется меткой. Метка идентифицирует поле (тип данных), которое следует после неё. Даже если на экране дисплея сразу после метки выведены ещё и индикаторы (таким образом, может появиться число из 4 или 5 цифр), метка всегда представляет собой первые три цифры.
См. ниже пример записи поля. Число 100 является меткой, определяющей поле заголовка основной библиографической записи на имя лица (автора).
100 1# $a King, Stephen |
В записи USMARC 10% меток используются достаточно, другие 90% встречаются только в редких случаях.
Индикаторы : За каждой меткой поля следуют две позиции символов (за исключением полей 001- 009). Одна или обе эти позиции символов могут использоваться для индикаторов. В некоторых полях применяется только первая или вторая позиция; в других полях используются обе позиции; а в таких полях, как 020 или 300, позиции не используются совсем. Если позиция индикатора не используется, индикатор характеризуется как "неопределённый", позиция остаётся незаполненной. В данной работе, в примерах, незаполненные или неопределённые позиции индикатора обозначаются символом " # ".
Значением каждого индикатора является цифра от 0 до 9. (Хотя правилами допускаются буквы, они используются редко). Даже, если два индикатора вместе могут казаться 2-х значным числом, в действительности они являются двумя отдельными цифрами. В приведённом ниже примере первые 3 цифры являются меткой (245 определяет поле заглавия), 2 следующие цифры (1 и 4) являются значениями индикаторов. "1"- первый индикатор; "4"- второй индикатор.
24514 $a The waste lands / $c adapted from Stephen King. |