Управление процессами. ЛекцииРефераты >> Программирование и компьютеры >> Управление процессами. Лекции
Таким образом, мы описали базовые средства взаимодействия процессов в UNIX: ïîðîæäåíèå ïðîöåññà, çàìåíà òåëà ïðîöåññà, âçàèìîäåéñòâèå ïðè ïîìîùè ïåðåäà÷/приемов сигналов.
Замечание: мы говорим о некотором обобщенном UNIX, реальные UNIX-ы могут иметь некоторые отличия друг от друга. На сегодняшний день имеются достаточно формализованные стандарты на интерфейсы ОС, в частности для UNIX это POSIX-standard, т.е. были проведены работы по стандартизации интерфейсов всех уровней для открытых систем. Основной задачей является унификация работы с системами, как на уровне запросов от пользователя, так и на уровне системных вызовов. В принципе, на сегодняшний день практически все разработчики ОС стараются привести свои системы к стандарту POSIX. В частности, Microsoft объявила, что системные вызовы и работа с файлами в Windows NT происходит в стандарте POSIX. Но так или иначе реальные коммерческие системы от этого стандарта отходят.
Второе замечание: мы начали рассматривать примеры, но крайне важно, чтобы все эти примеры были реализованы на практике, дабы убедиться, что они работают, посмотреть, как они работают, и добиться этой работы, так как версии UNIX могут не совпадать. Для этого следует посмотреть мануалы и, если надо, подправить программы.
Лекция №15
Трассировка процессов
К сегодняшнему дню, мы с вами рассмотрели стандартную схему образования процессов в UNIX-е и взаимодействие процессов с использованием системы передачи сигналов друг другу. Мы с вами обсудили организацию взаимодействия процессов с использованием т.н. неименованных каналов, это средство позволяет асинхронным образом передавать информацию от одного процесса к другому. Эти средства работают для родственных процессов.
Сегодня мы рассмотрим еще одну базовую функцию операционной системы UNIX, которая поддерживает трассировку процессов. Трассировка - это возможность одного процесса управлять ходом выполнения другого процесса. Давайте рассмотрим основные действия, выполняемые при отладке.
1. Установка контрольной точки.
2. Обработка ситуации, связанной с приходом в контрольную точку.
3. Чтение/запись информации в отлаживаемой программе.
4. Остановка/продолжение выполнения отлаживаемого процесса.
5. Шаговый режим отладки (остановка отлаживаемой программы после выполнения каждой инструкции).
6. Передача управления на произвольную точку отлаживаемой программы.
7. Обработка аварийных остановок (АВОСТ).
Вот семь позиций, которые реализуются почти в любом средстве отладки, с точностью до добавленных новых пунктов, в какой бы мы системе не работали.
Теперь посмотрим, какими средствами можно организовать выполнение этих функций в ОС UNIX. Есть функция ptrace.
ptrace(int op, int pid, int addr, int data);
Функция ptrace в подавляющем большинстве случаев работает в отцовском процессе, и через возможности этой функции организуется управление процессом сыном. В общем случае нельзя трассировать любой процесс. Для того чтобы процесс можно было трассировать, чтобы сыновий процесс мог управляться отцовским процессом, процесс-сын должен подтвердить разрешение на его трассировку. Для этого в самом начале своего выполнения процесс-сын должен выполнить обращение к функции ptrace с кодом операции равным нулю (op=0), который разрешает проводить трассировку данного процесса процессом-отцом. После этого в сыновьем процессе обращений к функции ptrace может не быть. Все управление будет производиться отцом.
Рассмотрим, какие возможности есть у отцовского процесса для управления сыном. Все возможности определяются значением параметра op. Параметр pid - идентификатор сыновьего процесса, который мы хотим трассировать.
· op=1 или op=2 - ptrace возвращает значение слова, адрес которого задан параметром addr (т.е. чтение слова из отлаживаемого процесса). Здесь указаны два значения op на тот случай, если есть самостоятельные адресные пространства в сегментах данных и кода (т.е. можно читать данные и код). В системах, где адресация единая в рамках процесса значение может быть любым.
· op=3 - читать информацию из контекста процесса. Обычно речь идет о доступе к информации из контекста данного процесса, сгруппированную в некоторую структуру. В этом случае параметр addr указывает смещение относительно начала этой структуры. В эта структуре размещена информация к которой я имею доступ посредством функции ptrace, в частности - регистры, текущее состояние процесса, счетчик адреса и т.д.
· op=4 или op=5 - запись данных, размещенных в параметре data, по адресу addr. Если происходит ошибка, ptrace возвращает -1 (уточнение в errno).
· op=6 - запись данных из data в контекст по смещению addr. Это означает, что можно прочесть регистры трассируемого процесса и при необходимости изменить их содержимое (в т.ч. счетчик адреса команды, т.е. сделать переход).
· op=7 - продолжение выполнения трассируемого процесса. Эта операция хитрая. Хитрость заключается в следующем. Пусть трассируемый процесс по какой-то причине был остановлен, например по причине прихода сигнала, процесс-отец дождался этого события с помощью функции wait и выполняет какие-то действия не запустив отлаживаемый процесс. Остановленному процессу могут приходить сигналы от других процессов. Что в этом случае делать с этими сигналами? Здесь как раз и используется ptrace с op=7. Если data=0, то процесс, который к этому моменту был приостановлен (сыновий), продолжит свое выполнение, и при этом все пришедшие (и необработанные еще) к нему сигналы будут проигнорированы. Если значение параметра data равно номеру сигнала, то это означает, что процесс (сыновий) возобновит свое выполнение, и при этом будет смоделирована ситуация прихода сигнала с этим номером. Все остальные сигналы будут проигнорированы. Кроме того, если addr=1, то процесс продолжит свое выполнение с того места, на котором он быт приостановлен. Если addr>1, то осуществиться переход по адресу addr (goto addr).
· op=8 - завершение трассируемого процесса.
· op=9 - установка бита трассировки. Это тот самый код, который обеспечивает пошаговое выполнение машинных команд. После каждой машинной команды в процессе происходит событие, связанное с сигналом SIG_TRAP.
Эта функция нами описана в некоторой модельной нотации, т.е. в разных системах ptrace может иметь несколько другую интерфейсную часть. В разных системах отличается доступ к контексту.
Все вышеописанные действия с функцией ptrace выполняются при остановленном отлаживаемом процессе (Он может быть остановлен из-за какой-то ошибке, может быть остановлен при приходе сигнала). Для того чтобы отцовский процесс мог остановить трассируемый сыновий процесс может быть выполнена следующая последовательность действий. Отцовский процесс посылает сыну сигнал (в сыне уже ранее выполнена ptrace c op=0), предположим SIG_TRAP, и после отправки сигнала отцовский процесс выполняет функцию wait. После ого как сигнал дошел до сыновьего процесса и тот остановился, отцовский процесс получает соответствующий код ответа из функции wait. После этого считается, что трассируемый процесс остановлен и можно выполнять все вышеописанные действия.