Принципы реализации машин БДРефераты >> Программирование и компьютеры >> Принципы реализации машин БД
Два свойства DBC 1012 характерны для всех сетевых МЕД:
обеспечение возможности увеличения мощности наращиванием числа обрабатывающих процессоров, так что производительность при этом растет линейно (показатель линейности роста производительности DBC 1012 от числа процессоров составляет 97%);
обеспечение надежности функционирования за счет дублирования данных в локальных УМП (т. е. обеспечивается работа без краха системы при выходе из строя отдельных процессоров или УМП).
Третье направление исследований в области МБД заключается в создании недорогих коммерческих устройств на серийных процессорных элементах с шинным интерфейсом (топология таких МБД изображена на рис. 2,а). В качестве примера рассмотрим МБД фирмы Britton Lee IDM 500, структурная схема которой изображена на рис. 7. Хотя эти изделия не ориентированы на высокопараллельную обработку и содержат ограниченное число функциональных процессоров, они удовлетворяют сформулированным выше принципам МН МБД и полностью реализуют все основные функции МБД. Структурная схема коммерческих МБД является частным случаем МН МБД (см. рис. 2,a). Роль СБП выполняет полупроводниковая память, к которой через общую шину подключаются периферийные контроллеры НМД со встроенными микропроцессорами AMD 2901, процессор обработки (процессор БД) на основе Z8002 и до 8 канальных процессоров для подключения к главной ЭВМ (канал IBM 370, интерфейс с VAX 750) или подключения к локальной сети (Ethernet). Кроне того, к общей шине может подключаться особый функциональный процессор (акселератор БД) для выполнения тех операций, которые являются узким местом (например, сортировка отношений). Старшая модель IDM SOO/XL с емкостью внешней памяти более 1 Гбайт на жестких МД и 500 Мбайт на МЛ имеет производительность 1000 транзакций/мин и одновременно обслуживает до 400 пользователей.
Развитием этого направления в разработках фирмы Britton Lee явился реляционный файлсервер (data/file server) RS310 - автономное устройство, подключаемое к локальной сети Ethernet или непосредственно к главной ЭВМ по интерфейсу RS232. Он включает:
собственно процессор базы данных (1 плата) на основе 28000 (10 Мгц); соединенную с этим процессором оперативную память емкостью 1 Мбайт на одной плате;
два жестких диска типа винчестер (5 1/4 дюйма) по 80 Мбайт каждый с соответствующим контроллером;
контроллер кассетной МЛ с 60 Мбайт на кассете (Streaming tape 1/4 дюйма);
до четырех интерфейсных плат двух типов (интерфейс RS232 с восемью выходами или интерфейс локальной сети Ethernet).
Каждая интерфейсная плата содержит процессор 28000 и свою локальную память. ,RS310 может быть использован или как автономная СУБД с выходным языком SQL, поддерживая при этом все функции СУБД, за исключением первого этапа трансляции с SQL (управление транзакциями, параллельное выполнение запросов, откаты и восстановления, автоматическую оптимизацию запросов и т. п.), или как интегрированная система управления файлами. При этом RS310 выступает для главной ЭВМ в качестве интеллектуального контроллера с буферизацией и удовлетворяет интерфейсу SCSI (Small Computer System Interface). RS310 обеспечивает одновременную работу до 50 пользователей и выполняет одновременно до 10 запросов. Ближайшая перспектива развития RS310 - увеличение внешней памяти до восьми НМД емкостью 478 Мбайт и МЛ емкостью 300 Мбайт.
Рис. 8. Специализированная машина для БД PYRAMID S 9810 (9820)
Дальнейшим развитием такого подхода к созданию коммерческих МБД является их реализация на модульной параллельной мультимикропроцессорной системе типа систем S27 и S81 фирмы Sequent и систем серии 9000 (9810, 9820) фирмы Pyramid-Sybase. На рис. 8 изображена структурная схема нового изделия фирмы Pyramid--система 9810(9820), являющаяся специализированной ЭВМ для БД. Эта специализированная машина предназначена для автономной поддержки СУБД Sybase с входным языком SQL, а также для поддержки прикладных информационных систем на основе этой СУБД для автоматизации конторской деятельности, разработки программного обеспечения и т. п. Система работает как data computer в сети ЭВМ и имеет интерфейс не только с локальной сетью Ethernet, но и Х25, telenet, darpa. Общая дисковая память достигает 15 Гбайт. Основная память, подключаемая к устройству управления памятью в виде плат до 4 и 16 Мбайт, может наращиваться до 128 Мбайт. В системе поддерживается виртуальное адресное пространство 4 Гбайт со страницами в 2048 байт. В качестве процессоров обработки выступают один или два спецпроцессора (CPU), реализованные в виде 32-разрядных процессоров с RISC-архитектурой. CPU имеет следующие характеристики:
время цикла- 100 нс; число 32-разрядных регистров - 528; кэш-память инструкции- 16 Кбайт; кэш-память - 64 Кбайт.
В RISC-процессорах реализован конвейерный режим выполнения инструкций.
Основой системы является собственная сверхбыстрая шина xtend (40 Мбайт/с), работающая по принципу коммутации сообщений. Интеллектуальный процессор ввода-вывода (ПВВ) реализован на базе микропроцессора AMD 29116 с быстродействием 5 млн. опер./с и содержит 14 параллельных ОМА-контроллеров, общая пропускная способность которых 11 Мбайт/с. ПЕВ обслуживает периферийные устройства, контроллеры НМД (скорость передачи в которых до 2,5 Мбайт/с) и контроллеры локальной сети (КЛС).
К общей шине подключается до 16 портов с интерфейсом RS232 для обслуживания интеллектуальных терминальных процессоров, с помощью которых к системе могут подключаться терминальные пользователи. Подключение к шине адаптера шины MULTIBUS открывает широкие возможности для подключения вспомогательных внешних устройств, в которых реализован интерфейс этой шины.
Управление системой осуществляется процессором поддержки системы, в функции которого входят также диагностика всех устройств и системы в целом, сервисная служба системы и т. п. В этом процессоре функционирует так называемая двухпортовая многопроцессорная операционная система, которая соединяет в себе две версии UNIX ОС: System V. AT&T и 4.0 Berkly.
Перспективы развития МБД
Создание высокопроизводительных МВД связывается с решением следующих проблем, по которым ведутся интенсивные исследования.
1. Создание специализированных архитектур МВД, сочетающих достоинства горизонтального параллелизма при выполнении одной операции с функциональным параллелизмом при выполнении последовательности операций и транзакций. Особую роль здесь играет реализация конвейерной потоковой обработки (data flow) применительно к операциям реляционной алгебры.
Рис. 5.9. Структура подсистемы потоковой обработки в МВД DFRU
Управление выполнением запросов при этом должно происходить собственно потоками данных, что облегчает задачу программного контроля выполнением операций, синхронизации их и т. п. Например, в проекте DFRU предпринята попытка аппаратно реализовать потоковую обработку в регулярной структуре обрабатывающих процессоров (рис. 9). Основным обрабатывающим элементом является универсальный компаратор кортежей (К). В матрице компараторов кортежей, соединяемых коммутирующими сетями, возможна динамическая коммутация выходов процессоров обработки i-го уровня со входами процессоров (i+1)-го уровня. В каждой строке матрицы по одному арифметическому процессору (АП) для реализации агрегатных функций. Связи между процессорами устанавливаются в соответствии с дугами дерева запроса (дерева реляционных операций). Это позволяет отображать дерева запроса в дерево процессоров, вырезаемых в данной матрице, так что каждой операции назначается один процессор обработки. После этого исходные отношения в потоке читаются из подсистемы массовой памяти и обрабатываются конвейерно в настроенном дереве процессоров, так что кортежи, образованные в операции i-го уровня, через коммутирующую сеть попадают в соответствующий процессор (i+l)-го уровня. На рис. 10 проиллюстрирован этот процесс для следующего запроса: «Выдать имена поставщиков, которые поставляют более 100 деталей типа I» применительно к трем исходным отношениям: