Ответы к экзамену по специальности Информатик-технологРефераты >> Программирование и компьютеры >> Ответы к экзамену по специальности Информатик-технолог
Терминальный анализ используется при составлении словарей и обеспечении доступа к информационным ресурсам.
Методика Т.А. опирается на приемы прикладной лингвистики:
4. Конкретные термины отражают определенную предметную область - семантическое пространство (вся отрасль знания);
5. Семантические поля – отдельные разделы, подразделы;
6. Класс условной эквивалентности – анализ основных слов/сочетаний, встречающихся в тексте, а также в установлении родовидовых связей между отдельными терминами - т.е. устанавливаются и устраняются синонимы, определение классов слов, которые определяются как дескрипторы.
Самые сложные процедуры:
- установление родовидовых отношений;
- установление ключевых слов.
В зарубежной практике: сбор и анализ профессиональной лексики использованных систем. Чем тщательнее анализ профессиональной лексики, тем меньше «шума».
6. Информационно-поисковый тезаурус.
При разработке ИПТ применяется ГОСТ 7.25-80 «Тезаурус информационно-поисковый одноязычный», ГОСТ 7.14-80 «-/- многоязычный». ИПТ представляет собой обычный словарь слов/сочетаний – отраслевой словарь. Тезаурус от лат. – хранилище, клад.
13 в. – составление книг о сокровищах.
17-18 вв. – словари-справочники при составлении служебных дисциплин.
1950 гг. С развитием машинного перевода (совр. тезаурус).
Тезаурус имеет узко прикладное назначение – обработка информационных запросов.*, информатика – Шрейдер, Гольштейн, Брониславский.
Методика составления тезаурусов:
1. предметная выборка всех ключевых слов конкретной предметной области;
2. определение всех взаимосвязей между отдельными терминами.
Сама предметная область м.б. задана как аксиома (область естественных знаний: математика, химия, физика).
3. уточнение предметной области;
4. анализ всего массива документов (насколько точна предметная область);
5. разработка всех взаимосвязей;
6. весь набор терминов на экспертизу спецов-аналитиков для которых разрабатывается тезаурус.
Вся стадия разработки ИПТ выполняется совместными усилиями спецов различных профессий: спец. ПК, спец. конкретной области.
Требования при разработке тезауруса:
1. массив документов д.б. достаточно однородным;
2. ограниченное число авторов (устранение разнобоя профессиональной лексики);
3. весь массив документов д.б. в машиночитаемом формате.
7. Классификаторы. Языки формализованного описания данных.
Классификаторы – нормативные документы, которые содержат систематический перечень объектов и присвоенные им коды. Классификации и кодированию принадлежат все социальные и экономические объекты. Информация, содержащаяся в этих классификаторах технико-экономическая и социальная информация, служит для информационного обеспечения в следующих областях:
- экономика;
- статистика;
- таможенное дело.
Разработано свыше 37 классификаторов, но еще применяются общесоюзные.
Основная цель разработки классификаторов связана с реализацией государственной программы перехода России на международные системы (учета, статистики). Данная программа была принята в 1992 г. Классификаторы оформляются в виде альбомов и есть машиночитаемый вариант. Свод всех классификаторов, а также нормативно-методические документы, составляют классификации и кодирования информации.
Основные задачи:
1) упорядочение и унификация технико-экономической и социальной информации;
2) обеспечение однозначности и сопоставимости данных;
3) создание условий для автоматизированной обработки данных;
4) создание банков данных классификаторов, применяемых на территории конкретной страны, а также международных делах.
Все классификаторы делятся на 3 группы:
1) классификаторы информации об управленческой документации, видах деятельности экономических и социальных показателей;
2) объединяет классификаторы информации об организационных словарях;
3) классификаторы информации о населении и кадрами.
Каждый классификатор имеет свое условное обозначение.
8. Функциональная стркутура ИПС.
Представляется в виде абстрактной кибернитической машиты. Котора состит из следующих узлов:
1) Устройство ввода.
Ввод сообщения, ввод запроса, индекстное описание текста - ПОД(поисковый образ документа).
2) Запоминающее устройство.
Активное хранилище - представляет собой совокупность поисковых образов сообщения.
Пассивное хранилище - в нем находится сами сообщения.
3) Решаущее устроиство .
Определение аресов сообщения. Главный исполнитель органа ИПС.
4) Устройство вывода.
получает адрес сообщения из решающего устройства, обеспечивает поиск в пасивном хранилищи и выводит их потребителю.
5) Устройство управления- обеспечивает последовательность методов поиска.
9. классификация ИПС.
При подходе к классификации ИПС исходит из требований пользователей к качеству функционирования системы, т.е. к ее способности выбирать из информационно-поискового массива требуемую информацию с достаточной полнотой, точностью и оперативностью.
Основными признаками, характеризующими ИПС с точки зрения удовлетворения требований пользователей, являются:
- тематика комплектования информационно-поискового массива;
- вид выполняемого информационного поиска (объект поиска и вид выдаваемой информации);
- режим функционирования;
- схемы размещения информацонно-поискового и документного массива:
- вид выполняемого информационного поиска.
По тематике комплектования ИПС делится на отраслевые, многоотраслевые (политематические) и узкотематические.
Отраслевые ИПС создаются, как правило, центральными отраслевыми органами НТИ в соответствии с закрепленными за ними тематикой. На базе отраслевых ИПС осуществляется информационное обслуживание руководящих работников и ведущих специалистов отрасли.
Многоотраслевые ИПС создаются в региональных органах НТИ (республиканских институтах информации, институтах информации автономных республик, областей) и межотраслевых территориальных органах НТИ. Осуществляет информационное обслуживание специалистов соответствующего региона.
Узкотематические ИПС содержатся в местных (локальных) службах информации (на предприятии, в организациях) для обеспечения информацией ученых и специалистов данной организации. Тематика информационного массива соответствует тематике их работы.
По виду и объекту информационного поиска ИПС делятся на:
- документальные;
- фактографические.
Документальные ИПС предназначены для поиска документов, содержащих запрашиваемую информацию в ответ на информационный запрос в зависимости от цели поиска документальные ИПС выдают либо библиографические описания документов, либо только адрес искомого документа, определяющий его местонахождение в хранилище.
Характерной особенностью всех документальных ИПС является то, что извлечение нужной информации из документа, найденного ИПС, осуществляет см потребитель.
Фактографические ИПС предназначены для поиска конкретных фактов, сведений, данных в ответ на информационные (фактографические) запросы без обращения потребителя к документам, в которых они содержатся. В фактографических ИПС единицами информации являются реквизиты (признаки и их значения). Реквизиты отражают определенные научные, технические, экономические свойства объектов, процессов, явлений и представляют собой логически неделимые элементы любой сложности.