Система управления базами знаний
Рефераты >> Информатика >> Система управления базами знаний

Неструктурированные данные и информация в электронном виде сегодня растут быстрее всего — их объем удваивается каждый год, и некоторые компании буквально тонут в океане данных.

Информация- это отражение внешнего мира с помощью знаков или сигналов. Информационная ценность сообщения заключается в новых сведениях, которые в нем содержатся (в уменьшении незнания).

Управление информацией (УИ) стало одной из ключевых задач во всех отраслях, и компании ищут способы сократить производственные расходы, позволяющие эффективно управлять электронным содержимым хранилищ данных, среди них:

· Управление информацией предприятия

· Автоматическое архивирование

· Создание многоуровневых хранилищ данных

· Резервирование информации

Информация, с которой имеют дело ЭВМ, разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная информация - в данных, с которыми эти программы работают. Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов - битов. Машинное слово для представления данных и машинное слово для представления команд, образующих программу, могут иметь одинаковое или разное число разрядов. В последнее время для представления данных и команд используются одинаковые по числу разрядов машинные слова. Однако в ряде случаев машинные слова разбиваются на группы по восемь двоичных разрядов, которые называются байтами.

Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц и выполнять операции над командами, как над данными. Содержимое памяти образует информационную базу.

В большинстве существующих ЭВМ возможно извлечение информации из любого подмножества разрядов машинного слова вплоть до одного бита. Во многих ЭВМ можно соединять два или более машинного слова в слово с большей длиной. Однако машинное слово является основной характеристикой информационной базы, т.к. его длина такова, что каждое машинное слово хранится в одной стандартной ячейке памяти, снабженной индивидуальным именем - адресом ячейки. По этому имени происходит извлечение информационных единиц из памяти ЭВМ и записи их в нее.

Параллельно с развитием структуры ЭВМ происходило развитие информационных структур для представления данных. Появились способы описания данных в виде векторов и матриц, возникли списочные структуры, иерархические структуры. В настоящее время в языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом. Появление баз данных (БД) знаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно храниться большие объемы информации, а специальные средства, образующие систему управления базами данных (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из базы данных и записывать их в нужном порядке в базу.

База данных — это совокупность сведений (о реальных объектах, процессах, событиях или явлениях), относящихся к определенной теме или задаче, организованная таким образом, чтобы обеспечить удобное представление этой совокупности как в целом, так и любой ее части. Реляционная база данных представляет собой множество взаимосвязанных таблиц, каждая из которых содержит информацию об объектах определенного типа. Каждая строка таблицы включает данные об одном объекте (например, клиенте, автомобиле, документе), а столбцы таблицы содержат различные характеристики этих объектов — атрибуты (например, наименования и адреса клиентов, марки и цены автомобилей). Строки таблицы называются записями; все записи имеют одинаковую структуру — они состоят из полей, в которых хранятся атрибуты объекта. Каждое поле записи содержит одну характеристику объекта и имеет строго определенный тип данных (например, текстовая строка, число, дата). Все записи имеют одни и те же поля, только в них содержатся разные значения атрибутов.

Система моделирования бизнес-процессов должна обладать искусственным интеллектом (ИИ). Внедрение такой системы должно оставить за человеком только творческие задачи, полностью автоматизировав рутинные операции по управлению современным предприятием.

Такая система должна обладать знаниями и способностями, сопоставимыми с бизнес-аналитиком среднего уровня. Это означает, что система управления базой знаний (именно знаний, а не данных) должна обеспечить представление и обработку модели бизнес-процесса, сопоставимой по своей сложности с моделью бизнес-процесса, используемой сознанием человека.

В ЭВМ знания так же, как и данные, отображаются в знаковой форме - в виде формул, текста, файлов, информационных массивов и т.п. Поэтому можно сказать, что знания - это особым образом организованные данные. Но это было бы слишком узкое понимание. А между тем, в системах ИИ знания являются основным объектом формирования, обработки и исследования. База знаний, наравне с базой данных, - необходимая составляющая программного комплекса искусственного интеллекта.

База знаний - совокупность систематизированных основополагающих сведений, относящихся к определённой области знания, хранящихся в памяти ЭВМ, объём которых необходим и достаточен для решения заданного круга теоретических или практических задач. В системе управления БЗ используются методы искусственного интеллекта, специальные языки описания знаний, интеллектуальный интерфейс.

Машины, реализующие алгоритмы искусственного интеллекта, называются машинами, основанными на знаниях, а подраздел теории искусственного интеллекта, связанный с построением экспертных систем, - инженерией знаний.

Знания о предметной области, ее объектах и закономерностях описываются на некотором формальном языке, называемом языком представления знаний (ЯПЗ). При этом, ЯПЗ должен обеспечивать не только возможность формальной записи знаний, но и необходимую обработку элементов этой записи. Совокупность знаний, хранящаяся во внешней памяти ЭВМ, называется системой знаний; над ней производятся различные операции: поиск необходимой информации, ее модификация, интерпретация знаний, вывод новых знаний на основе имеющихся и т.д. Организация интеллектуальных компьютерных систем работы со знаниями в той или иной прикладной области зависят не только от специфики самих систем, но и в существенной мере от используемых ЯПЗ и метода хранения системы знаний в ЭВМ. В современных ИИ-системах знания хранятся в специальных БД - базах знаний (БЗ). Существует самая непосредственная аналогия между понятиями модель данных, используемая в БД-технологии и понятием способ представления знаний в БЗ-технологии. Грубо говоря, можно сказать, что если БД содержит собственно данные о некоторой предметной области, то БЗ содержит как сами данные, так и описание их свойств. Однако между БД и БЗ существуют принципиальные различия, рассматриваемые ниже


Страница: