А. Григорьев - О чём не пишут в книгах по Delphi
- Название:О чём не пишут в книгах по Delphi
- Автор:
- Жанр:
- Издательство:БХВ-Петербург
- Год:2008
- Город:СПб
- ISBN:978-5-9775-019003
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
А. Григорьев - О чём не пишут в книгах по Delphi краткое содержание
Рассмотрены малоосвещённые вопросы программирования в Delphi. Описаны методы интеграции VCL и API. Показаны внутренние механизмы VCL и приведены примеры вмешательства в эти механизмы. Рассмотрено использование сокетов в Delphi: различные механизмы их работы, особенности для протоколов TCP и UDP и др. Большое внимание уделено разбору ситуаций возникновения ошибок и получения неверных результатов в "простом и правильном" коде. Отдельно рассмотрены особенности работы с целыми, вещественными и строковыми типами данных, а также приведены примеры неверных результатов, связанных с ошибками компилятора, VCL и др. Для каждой из таких ситуаций предложены методы решения проблемы. Подробно рассмотрен синтаксический анализ в Delphi на примере арифметических выражений. Многочисленные примеры составлены с учётом различных версий: от Delphi 3 до Delphi 2007. Прилагаемый компакт-диск содержит примеры из книги.
Для программистов
О чём не пишут в книгах по Delphi - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Вся разница между двумя примерами заключается в том, как получается указатель на строку. В первом примере он является результатом приведения типа строки к PChar
, а во втором — операции взятия адреса первого символа строки. По идее, это должно приводить к одинаковому результату, однако компилятор, зная, что указатель получается, возможно, для того, чтобы с его помощью менять содержимое строки, вставляет сюда неявный вызов UniqueString
. В результате этого для S1
выделяется в динамической памяти другая область, чем для S2
, и манипуляции с содержимым S1
больше не затрагивают S2
.
Неявный вызов UniqueString
при обращении к символу строки по индексу выполняется всегда, когда у компилятора есть основания ожидать изменения строки. Это снижает производительность, т.к. многие вызовы UniqueString
оказываются излишними. Например, если выполняется посимвольная модификация строки в цикле, UniqueString
будет вызываться на каждой итерации цикла, хотя достаточно одного вызова — перед началом цикла. Поэтому в тех случаях, когда производительность критична, посимвольную модификацию строки лучше выполнять низкоуровневыми методами, обращаясь к символам через указатели и обеспечив уникальность строки самостоятельно. Что же касается скорости получения указателя, то тут наиболее быстрым является приведение переменной типа AnsiString
к типу Pointer
, т.к. это вообще не приводит к генерации дополнительного кода. Приведение к типу PChar
работает медленнее потому, что выполняется неявный вызов функции _LStrToPChar
, а получение адреса первого символа снижает производительность из-за неявного вызова UniqueString
.
Еще раз напомним, что низкоуровневые операции с указателями небезопасны в том смысле, что компилятор почти не способен указать разработчику на ошибки в коде, если такие будут. Поэтому применять быстрые низкоуровневые средства доступа к отдельным символам строки следует только тогда, когда в этом действительно есть необходимость.
3.3.6. Нулевой символ в середине строки
Хотя символ #0
и добавляется в конец каждой строки AnsiString
, он уже не является признаком ее конца, т.к. длина строки хранится отдельно. Это позволяет размещать символы #0
и в середине строки. Но нужно учитывать, что полноценное преобразование такой строки в PChar
невозможно — это иллюстрируется примером Zero на компакт-диске (листинг 3.32).
#0
procedure TForm1.Button1Click(Sender: TObject);
var
S1, S2, S3: string;
P: PChar;
begin
S1 := 'Test'#0'Test';
S2 := S1;
UniqueString(S2);
P := PChar(S1);
S3 := P;
Label1.Caption := IntToStr(Length(S2));
Label2.Caption := IntToStr(Length(S3));
end;
В первую метку будет выведено число 9 (длина исходной строки), во вторую — 4. Мы видим, что при копировании одной строки AnsiString
в другую символ #0
в середине строки — не помеха (вызов UniqueString
добавлен для того, чтобы обеспечить реальное копирование строки, а не только копирование указателя). А вот как только мы превращаем эту строку PChar
, информация о ее истинной длине теряется, и при обратном преобразовании компилятор ориентируется на символ #0
, в результате чего строка "обрубается".
Потеря куска строки после символа #0
происходит всегда, когда есть преобразование ShortString
или AnsiString
в PChar
, даже неявное. Например, все API-функции работают с нуль-терминированными строками, а визуальные компоненты — просто обертки над этими функциями, поэтому вывести с их помощью на экран строку, содержащую #0
, целиком невозможно. Но главный "подводный камень", связанный с символом #0
в середине строки, заключается в том, что целый ряд стандартных функций для работы со строками AnsiString
на самом деле вызывают API-функции (или даже библиотечные функции Delphi, предназначенные для работы с PChar
, что приводит к игнорированию "хвоста" после #0
. Следующий код (листинг 3.33. пример ZeroFind на компакт-диске) иллюстрирует эту проблему.
AnsiPos
с символом #0
procedure TForm1.Button1Click(Sender: TObject);
begin
Label1.Caption := IntToStr(AnsiPos('Z', 'A'#0'Z'));
end;
Хотя символ "Z" присутствует в строке, в которой производится поиск, на экран будет выведен "0", что означает отсутствие искомой подстроки. Это связано с тем, что функция AnsiPos
использует функции StrPos
и CompareString
, предназначенные для работы со строками PChar
, поэтому поиск за символом #0
, не производится. Если заменить в этом примере функцию AnsiPos
на Pos
, которая работает с типом AnsiString
должным образом, на экран будет выведено правильное значение "3".
Описанные проблемы заставляют очень осторожно относиться к возможному появлению символа #0
в середине строк AnsiString
— это может стать источником неожиданных проблем.
3.3.7. Функция, возвращающая AnsiString
Очень интересный "подводный камень", связанный с типом AnsiString
рассмотрен в статье [4]. Проиллюстрируем его следующим кодом (листинг 3.34, пример StringResult на компакт-диске).
function AddOne: string;
begin
Result := Result + '1';
end;
procedure TForm1.Button1Click(Sender: TObject);
var
S: string;
begin
S := 'Test';
S := AddOne;
Label1.Caption := S;
end;
Если человека, не знакомого с этой особенностью компилятора, попросить предсказать, что появится на экране в результате выполнения этого кода, его рассуждения будут звучать, скорее всего, примерно так: "Так как Result
в функции AddOne
— это локальная переменная типа string
, то, как и все такие переменные, она будет инициализирована пустым значением. Добавление символа '1'
к пустой строке даст в результате строку '1'
, которая и будет выведена на экран. Кстати, на строке S := 'Test'
компилятор должен выдать предупреждение, что значение, присвоенное переменной S
, нигде не используется".
Однако эти рассуждения неверны. На экране появится надпись Test1, т.е. первоначальное значение переменной S
будет учтено в функции AddOne
. Это происходит потому, что с точки зрения двоичного кода переменная Result
это не локальная переменная, а параметр-переменная, как если бы функции AddOne
была объявлена так:
procedure AddOne(var Result: string);
Именно так компилятор обрабатывает функции, тип результата которых AnsiString
(и ShortString
, кстати, тоже). Какая переменная будет передана в качестве параметра, — это зависит от того, как вызвана функция, точнее, куда идет ее результат. Иногда компилятору приходится неявно имитировать какую-то переменную, а иногда он может воспользоваться реально существующей переменной. В нашем случае он воспользовался переменной S
, передав её в качестве параметра. Строковые параметры-переменные, в отличие от локальных переменных, по понятным причинам не инициализируются пустой строкой, поэтому переменная Result
сохраняет значение переменной S
, что и приводит к наблюдаемому результату.
Интервал:
Закладка: