а = 1;
b = а;
Это происходит потому, что в последнем случае четко видно зависимость между переменными a
и b
. Однако ни компилятор, ни процессор не имеют никакой информации о коде, который выполняется в других контекстах. Часто важно, чтобы результаты записи в память "виделись" в нужном порядке другим кодом, который выполняется за пределами нашей досягаемости. Такая ситуация часто имеет место при работе с аппаратными устройствами, а также возникает на многопроцессорных машинах.
Функция rmb()
позволяет установить барьер чтения памяти (read memory barrier). Она гарантирует, что никакие операции чтения памяти, которые выполняются перед вызовом функции rmb()
, не будут переставлены местами с операциями, которые выполняются после этого вызова. Иными словами, все операции чтения, которые указаны до этого вызова, будут выполнены перед этим вызовом, а все операции чтения, которые указаны после этого вызова никогда не будут выполняться перед ним.
Функция wmb()
позволяет установить барьер записи памяти (write barrier). Она работает так же, как и функция rmb()
, но не с операциями чтения, а с операциями записи — гарантируется, что операции записи, которые находятся по разные стороны барьера, никогда не будут переставлены местами друг с другом.
Функция mb()
позволяет создать барьер на чтение и запись. Никакие операции чтения и записи, которые указаны по разные стороны вызова функции mb()
, не будут переставлены местами друг с другом. Эта функция предоставляется пользователю, так как существует машинная инструкция (часто та же инструкция, что используется вызовом rmb()
), которая позволяет установить барьер на чтение и запись.
Вариант функции rmb()
— read_barrier_depends()
— обеспечивает создание барьера чтения, но только для тех операций чтения, от которых зависят следующие, за ними операции чтения. Гарантируется, что все операции чтения, которые указаны перед барьером выполнятся перед теми операциями чтения, которые находятся после барьера и зависят от операций чтения, идущих перед барьером. Все понятно? В общем, эта функция позволяет создать барьер чтения, так же как и функция rmb()
, но этот барьер будет установлен только для некоторых операций чтения — тех, которые зависят друг от друга.
Для некоторых аппаратных платформ функция read_barrier_depends()
выполняется значительно быстрее, чем функция rmb()
, так как для этих платформ функция read _barrier_depends()
просто не нужна и вместо нее выполняется инструкция noop
(нет операции).
Рассмотрим пример использования функций mb()
и rmb()
. Первоначальное значение переменной а
равно 1, а переменной b
равно 2.
Поток 1 Поток 2
а = 3; -
mb(); -
b=4; c=b;
- rmb();
- d=a;
Без использования барьеров памяти для некоторых процессоров возможна ситуация, в которой после выполнения этих фрагментов кода переменной с
присвоится новое , значение переменной b
, в то время как переменной d
присвоится старое значение переменной а
. Например, переменная с
может стать равной 4 (что мы и хотим), а переменная d
может остаться равной 1 (чего мы не хотим). Использование функции mb()
позволяет гарантировать, что переменные a
и b
записываются в указанном порядке, а функция rmb()
гарантирует, что чтение переменных b
и а
будет выполнено в указанном порядке.
Такое изменение порядка выполнения операций может возникнуть из-за того, что современные процессоры обрабатывают и передают на выполнение инструкции в измененном порядке для того, чтобы оптимизировать использование конвейеров. Это может привести к тому, что инструкции чтения переменных b
и а
выполнятся не в том порядке. Функции rmb()
и wmb()
соответствуют инструкциям, которые заставляют процессор выполнить все незаконченные операции чтения и записи перед тем, как продолжить работу далее.
Рассмотрим простой пример случая, когда можно использовать функцию read_barrier_depends()
вместо функции rmb()
. В этом примере изначально переменная а
равна 1, b
— 2, а p
— &b
.
Поток 1 Поток 2
а=3; -
mb(); -
p=&а; pp=p;
- read_barrier_depends();
- b=*pp;
Снова без использования барьеров памяти появляется возможность того, что переменной b
будет присвоено значение *pp
до того, как переменной pp
будет присвоено значение переменной p
. Функция read_barrier_depends()
обеспечивает достаточный барьер, так как считывание значения *pp
зависит от считывания переменной p
. Здесь также будет достаточно использовать функцию rmb()
, но поскольку операции чтения зависимы между собой, то можно использовать потенциально более быструю функцию read_barrier_depends()
. Заметим, что в обоих случаях требуется использовать функцию mb()
для того, чтобы гарантировать необходимый порядок выполнения операций чтения-записи в потоке 1.
Читать дальше