Понимание того, что ядро не так уж страшно, как кажется, может стать первым шагом к пониманию того, что все имеет свой смысл . Однако чтобы достичь этой утопии, необходимо стараться, читать исходный код, изменять его и не падать духом.
Вводный материал, который был представлен в первой главе, и базовые моменты, которые описаны в текущей, надеюсь, станут хорошим фундаментом для тех знаний, которые будут получены при прочтении всей книги. В следующих разделах будут рассмотрены конкретные подсистемы ядра и принципы их работы.
Глава 3
Управление процессами
Процесс — одно из самых важных абстрактных понятий в Unix-подобных операционных системах [8] Другая абстракция — это файл.
. По сути, процесс — это программа, т.е. объектный код, хранящийся на каком-либо носителе информации и находящийся в состоянии исполнения. Однако процесс — это не только исполняемый программный код, который для операционной системы Unix часто называется text section ( сегмент текста или сегмент кода ). Процессы также включают в себя сегмент данных ( data section ), содержащий глобальные переменные; набор ресурсов, таких как открытые файлы и ожидающие на обработку сигналы; адресное пространство и один или более потоков выполнения . Процесс — это живой результат выполнения программного кода.
Потоки выполнения, которые часто для сокращения называют просто потоками ( thread ), представляют собой объекты, выполняющие определенные операции внутри процесса. Каждый поток включает в себя уникальный счетчик команд (program counter), стек выполнения и набор регистров процессора. Ядро планирует выполнение отдельных потоков, а не процессов. В традиционных Unix-подобных операционных системах каждый процесс содержал только один поток. Однако в современных системах многопоточные программы используются очень широко. Как будет показано далее, в операционной системе Linux используется уникальная реализация потоков — между процессами и потоками нет никакой разницы. Поток в операционной системе Linux — это специальный тип процесса.
В современных операционных системах процессы предусматривают наличие двух виртуальных ресурсов: виртуального процессора и виртуальной памяти. Виртуальный процессор создает для процесса иллюзию, что этот процесс монопольно использует всю компьютерную систему, за исключением, может быть, только того, что физическим процессором совместно пользуются десятки других процессов. В главе 4, "Планирование выполнения процессов", эта виртуализация обсуждается более подробно. Виртуальная память предоставляет процессу иллюзию того, что он один располагает всей памятью компьютерной системы. Виртуальной памяти посвящена глава 11, "Управление памятью". Потоки совместно используют одну и ту же виртуальную память, хотя каждый поток получает свой виртуальный процессор.
Следует подчеркнуть, что сама по себе программа процессом не является; процесс — это выполняющаяся программа плюс набор соответствующих ресурсов. Конечно, может существовать два процесса, которые исполняют одну и ту же программу. В действительности может даже существовать два или больше процессов, которые совместно используют одни и те же ресурсы, такие как открытые файлы, или адресное пространство. Процесс начинает свое существование с момента создания, что впрочем не удивительно. В операционной системе Linux такое создание выполняется с помощью системного вызова fork()
(буквально, ветвление или вилка), который создает новый процесс путем полного копирования уже существующего. Процесс, который вызвал системную функцию fork()
, называется порождающим ( родительским , parent ), новый процесс именуют порожденным ( дочерний , child ). Родительский процесс после этого продолжает выполнение, а порожденный процесс начинает выполняться с места возврата из системного вызова. Часто после разветвления в одном из процессов желательно выполнить какую-нибудь другую программу. Семейство функций exec*()
позволяет создать новое адресное пространство и загрузить в него новую программу. В современных ядрах Linux функция fork()
реализована через системный вызов clone()
, который будет рассмотрен в следующем разделе.
Выход из программы осуществляется с помощью системного вызова exit()
. Эта функция завершает процесс и освобождает все занятые им ресурсы. Родительский процесс может запросить о состоянии порожденных им процессов с помощью системного вызова wait4()
[9] В ядре реализован системный вызов wait4() . В операционной системе Linux через библиотеку функций языка С доступны функции wait() , waitpid() , wait3() и wait4() . Все эти функции возвращают информацию о состоянии завершившегося процесса, хотя в несколько разной семантике.
, который заставляет один процесс ожидать завершения другого. Когда процесс завершается, он переходит в специальное состояние зомби ( zombie ), которое используется для представления завершенного процесса до того момента, пока порождающий его процесс не вызовет системную функцию wait()
или waitpid()
.
Читать дальше