В данном примере все достаточно очевидно, но в более сложных случаях разработчик программы может и не подозревать, что строка, с которой он работает, разделяется несколькими переменными. Справка Delphi советует сначала обеспечить уникальность копии строки с помощью UniqueString
и только потом работать с ней через PChar
, если в этом есть необходимость.
Рассмотрим еще один пример, практически не отличающийся от предыдущего (листинг 3.31).
Листинг 3.31. Отсутствие побочного изменения переменной S2
при изменении S1
procedure TForm1.Button2Click(Sender: TObject);
var
S1, S2: string;
P: PChar;
begin
S1 := 'Test';
UniqueString(S1);
S2 := S1;
P := @S1[1];
P[0] := 'F';
Label1.Caption := S2;
end;
В этом случае на экран будет выведено Test, т.е. побочного изменения переменной не произойдёт, хотя переменная S1
по прежнему изменяется в обход стандартных механизмов Delphi.
Вся разница между двумя примерами заключается в том, как получается указатель на строку. В первом примере он является результатом приведения типа строки к PChar
, а во втором — операции взятия адреса первого символа строки. По идее, это должно приводить к одинаковому результату, однако компилятор, зная, что указатель получается, возможно, для того, чтобы с его помощью менять содержимое строки, вставляет сюда неявный вызов UniqueString
. В результате этого для S1
выделяется в динамической памяти другая область, чем для S2
, и манипуляции с содержимым S1
больше не затрагивают S2
.
Неявный вызов UniqueString
при обращении к символу строки по индексу выполняется всегда, когда у компилятора есть основания ожидать изменения строки. Это снижает производительность, т.к. многие вызовы UniqueString
оказываются излишними. Например, если выполняется посимвольная модификация строки в цикле, UniqueString
будет вызываться на каждой итерации цикла, хотя достаточно одного вызова — перед началом цикла. Поэтому в тех случаях, когда производительность критична, посимвольную модификацию строки лучше выполнять низкоуровневыми методами, обращаясь к символам через указатели и обеспечив уникальность строки самостоятельно. Что же касается скорости получения указателя, то тут наиболее быстрым является приведение переменной типа AnsiString
к типу Pointer
, т.к. это вообще не приводит к генерации дополнительного кода. Приведение к типу PChar
работает медленнее потому, что выполняется неявный вызов функции _LStrToPChar
, а получение адреса первого символа снижает производительность из-за неявного вызова UniqueString
.
Примечание
Еще раз напомним, что низкоуровневые операции с указателями небезопасны в том смысле, что компилятор почти не способен указать разработчику на ошибки в коде, если такие будут. Поэтому применять быстрые низкоуровневые средства доступа к отдельным символам строки следует только тогда, когда в этом действительно есть необходимость.
3.3.6. Нулевой символ в середине строки
Хотя символ #0
и добавляется в конец каждой строки AnsiString
, он уже не является признаком ее конца, т.к. длина строки хранится отдельно. Это позволяет размещать символы #0
и в середине строки. Но нужно учитывать, что полноценное преобразование такой строки в PChar
невозможно — это иллюстрируется примером Zero на компакт-диске (листинг 3.32).
Листинг 3.32. Потеря остатка строки после символа #0
procedure TForm1.Button1Click(Sender: TObject);
var
S1, S2, S3: string;
P: PChar;
begin
S1 := 'Test'#0'Test';
S2 := S1;
UniqueString(S2);
P := PChar(S1);
S3 := P;
Label1.Caption := IntToStr(Length(S2));
Label2.Caption := IntToStr(Length(S3));
end;
В первую метку будет выведено число 9 (длина исходной строки), во вторую — 4. Мы видим, что при копировании одной строки AnsiString
в другую символ #0
в середине строки — не помеха (вызов UniqueString
добавлен для того, чтобы обеспечить реальное копирование строки, а не только копирование указателя). А вот как только мы превращаем эту строку PChar
, информация о ее истинной длине теряется, и при обратном преобразовании компилятор ориентируется на символ #0
, в результате чего строка "обрубается".
Потеря куска строки после символа #0
происходит всегда, когда есть преобразование ShortString
или AnsiString
в PChar
, даже неявное. Например, все API-функции работают с нуль-терминированными строками, а визуальные компоненты — просто обертки над этими функциями, поэтому вывести с их помощью на экран строку, содержащую #0
, целиком невозможно. Но главный "подводный камень", связанный с символом #0
в середине строки, заключается в том, что целый ряд стандартных функций для работы со строками AnsiString
на самом деле вызывают API-функции (или даже библиотечные функции Delphi, предназначенные для работы с PChar
, что приводит к игнорированию "хвоста" после #0
. Следующий код (листинг 3.33. пример ZeroFind на компакт-диске) иллюстрирует эту проблему.
Читать дальше
Конец ознакомительного отрывка
Купить книгу