Ответы к экзамену по специальности Информатик-технолог
Рефераты >> Программирование и компьютеры >> Ответы к экзамену по специальности Информатик-технолог

Терминальный анализ используется при составлении словарей и обеспечении доступа к информационным ресурсам.

Методика Т.А. опирается на приемы прикладной лингвистики:

4. Конкретные термины отражают определенную предметную область - семантическое пространство (вся отрасль знания);

5. Семантические поля – отдельные разделы, подразделы;

6. Класс условной эквивалентности – анализ основных слов/сочетаний, встречающихся в тексте, а также в установлении родовидовых связей между отдельными терминами - т.е. устанавливаются и устраняются синонимы, определение классов слов, которые определяются как дескрипторы.

Самые сложные процедуры:

- установление родовидовых отношений;

- установление ключевых слов.

В зарубежной практике: сбор и анализ профессиональной лексики использованных систем. Чем тщательнее анализ профессиональной лексики, тем меньше «шума».

6. Информационно-поисковый тезаурус.

При разработке ИПТ применяется ГОСТ 7.25-80 «Тезаурус информационно-поисковый одноязычный», ГОСТ 7.14-80 «-/- многоязычный». ИПТ представляет собой обычный словарь слов/сочетаний – отраслевой словарь. Тезаурус от лат. – хранилище, клад.

13 в. – составление книг о сокровищах.

17-18 вв. – словари-справочники при составлении служебных дисциплин.

1950 гг. С развитием машинного перевода (совр. тезаурус).

Тезаурус имеет узко прикладное назначение – обработка информационных запросов.*, информатика – Шрейдер, Гольштейн, Брониславский.

Методика составления тезаурусов:

1. предметная выборка всех ключевых слов конкретной предметной области;

2. определение всех взаимосвязей между отдельными терминами.

Сама предметная область м.б. задана как аксиома (область естественных знаний: математика, химия, физика).

3. уточнение предметной области;

4. анализ всего массива документов (насколько точна предметная область);

5. разработка всех взаимосвязей;

6. весь набор терминов на экспертизу спецов-аналитиков для которых разрабатывается тезаурус.

Вся стадия разработки ИПТ выполняется совместными усилиями спецов различных профессий: спец. ПК, спец. конкретной области.

Требования при разработке тезауруса:

1. массив документов д.б. достаточно однородным;

2. ограниченное число авторов (устранение разнобоя профессиональной лексики);

3. весь массив документов д.б. в машиночитаемом формате.

7. Классификаторы. Языки формализованного описания данных.

Классификаторы – нормативные документы, которые содержат систематический перечень объектов и присвоенные им коды. Классификации и кодированию принадлежат все социальные и экономические объекты. Информация, содержащаяся в этих классификаторах технико-экономическая и социальная информация, служит для информационного обеспечения в следующих областях:

- экономика;

- статистика;

- таможенное дело.

Разработано свыше 37 классификаторов, но еще применяются общесоюзные.

Основная цель разработки классификаторов связана с реализацией государственной программы перехода России на международные системы (учета, статистики). Данная программа была принята в 1992 г. Классификаторы оформляются в виде альбомов и есть машиночитаемый вариант. Свод всех классификаторов, а также нормативно-методические документы, составляют классификации и кодирования информации.

Основные задачи:

1) упорядочение и унификация технико-экономической и социальной информации;

2) обеспечение однозначности и сопоставимости данных;

3) создание условий для автоматизированной обработки данных;

4) создание банков данных классификаторов, применяемых на территории конкретной страны, а также международных делах.

Все классификаторы делятся на 3 группы:

1) классификаторы информации об управленческой документации, видах деятельности экономических и социальных показателей;

2) объединяет классификаторы информации об организационных словарях;

3) классификаторы информации о населении и кадрами.

Каждый классификатор имеет свое условное обозначение.

8. Функциональная стркутура ИПС.

Представляется в виде абстрактной кибернитической машиты. Котора состит из следующих узлов:

1) Устройство ввода.

Ввод сообщения, ввод запроса, индекстное описание текста - ПОД(поисковый образ документа).

2) Запоминающее устройство.

Активное хранилище - представляет собой совокупность поисковых образов сообщения.

Пассивное хранилище - в нем находится сами сообщения.

3) Решаущее устроиство .

Определение аресов сообщения. Главный исполнитель органа ИПС.

4) Устройство вывода.

получает адрес сообщения из решающего устройства, обеспечивает поиск в пасивном хранилищи и выводит их потребителю.

5) Устройство управления- обеспечивает последовательность методов поиска.

9. классификация ИПС.

При подходе к классификации ИПС исходит из требований пользователей к качеству функционирования системы, т.е. к ее способности выбирать из информационно-поискового массива требуемую информацию с достаточной полнотой, точностью и оперативностью.

Основными признаками, характеризующими ИПС с точки зрения удовлетворения требований пользователей, являются:

- тематика комплектования информационно-поискового массива;

- вид выполняемого информационного поиска (объект поиска и вид выдаваемой информации);

- режим функционирования;

- схемы размещения информацонно-поискового и документного массива:

- вид выполняемого информационного поиска.

По тематике комплектования ИПС делится на отраслевые, многоотраслевые (политематические) и узкотематические.

Отраслевые ИПС создаются, как правило, центральными отраслевыми органами НТИ в соответствии с закрепленными за ними тематикой. На базе отраслевых ИПС осуществляется информационное обслуживание руководящих работников и ведущих специалистов отрасли.

Многоотраслевые ИПС создаются в региональных органах НТИ (республиканских институтах информации, институтах информации автономных республик, областей) и межотраслевых территориальных органах НТИ. Осуществляет информационное обслуживание специалистов соответствующего региона.

Узкотематические ИПС содержатся в местных (локальных) службах информации (на предприятии, в организациях) для обеспечения информацией ученых и специалистов данной организации. Тематика информационного массива соответствует тематике их работы.

По виду и объекту информационного поиска ИПС делятся на:

- документальные;

- фактографические.

Документальные ИПС предназначены для поиска документов, содержащих запрашиваемую информацию в ответ на информационный запрос в зависимости от цели поиска документальные ИПС выдают либо библиографические описания документов, либо только адрес искомого документа, определяющий его местонахождение в хранилище.

Характерной особенностью всех документальных ИПС является то, что извлечение нужной информации из документа, найденного ИПС, осуществляет см потребитель.

Фактографические ИПС предназначены для поиска конкретных фактов, сведений, данных в ответ на информационные (фактографические) запросы без обращения потребителя к документам, в которых они содержатся. В фактографических ИПС единицами информации являются реквизиты (признаки и их значения). Реквизиты отражают определенные научные, технические, экономические свойства объектов, процессов, явлений и представляют собой логически неделимые элементы любой сложности.


Страница: