Д. Стефенс - C++. Сборник рецептов
- Название:C++. Сборник рецептов
- Автор:
- Жанр:
- Издательство:КУДИЦ-ПРЕСС
- Год:2007
- Город:Москва
- ISBN:5-91136-030-6
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Д. Стефенс - C++. Сборник рецептов краткое содержание
Данная книга написана экспертами по C++ и содержит готовые рецепты решения каждодневных задач для программистов на С++. Один из авторов является создателем библиотеки Boost Iostreams и нескольких других библиотек C++ с открытым исходным кодом. В книге затрагивается множество тем, вот лишь некоторые из них: работа с датой и временем; потоковый ввод/вывод; обработка исключений; работа с классами и объектами; сборка приложений; синтаксический анализ XML-документов; программирование математических задач. Читатель сможет использовать готовые решения, а сэкономленное время и усилия направить на решение конкретных задач.
C++. Сборник рецептов - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
doc.InsertEndChild(root);
doc.SaveFile("hello.xml");
Рецепты 14.3 и 14.4.
14.2. Работа со строками Xerces
Требуется обеспечить надежную и простую работу со строками с расширенным набором символов, используемыми библиотекой Xerces. В частности, необходимо уметь сохранять строки, возвращаемые функциями библиотеки Xerces, а также выполнять преобразования между строками Xerces и строками стандартной библиотеки С++.
Сохранять строки с расширенным набором символов, возвращаемые функциями библиотеки Xerces, можно с помощью шаблона std::basic_string
, специализированного типом с расширенным набором символов XMLCh
библиотеки Xerces.
typedef std::basic_string XercesString;
Для выполнения преобразований между строками Xerces и строками, состоящими из стандартных символов, используйте перегруженный статический метод transcode()
из класса xercesc::XMLString
, который определен в заголовочном файле xercesc/util/XMLString.hpp .
В примере 14.4 определяются две перегруженные вспомогательные функции, toNative
и fromNative
, которые используют transcode
для преобразования строк со стандартными символами в строки Xerces
и обратно . Каждая функция имеет две версии: одна принимает строку в C-стиле, а другая принимает строку стандартной библиотеки С++. Для выполнения преобразований между строками Xerces и строками со стандартными символами вполне достаточно иметь эти служебные функции; после того как вы определили эти функции, вам уже никогда не потребуется вызывать непосредственно transcode
.
Пример 14.4. Заголовочный файл xerces_strings.hpp, используемый для выполнения преобразований между строками Xerces и строками со стандартными символами
#ifndef XERCES_STRINGS_HPP_INCLUDED
#define XERCES_STRINGS_HPP_INCLUDED
#include
#include
#include
typedef std::basic_string XercesString;
// Преобразует строку со стандартными символами
// в строку с расширенным набором символов
inline XercesString fromNative(const char* str) {
boost::scoped_array ptr(xercesc::XMLString::transcode(str));
return XercesString(ptr.get());
}
// Преобразует строку со стандартными символами
// в строку с расширенным набором символов.
inline XercesString fromNative(const std::string& str) {
return fromNative(str.c_str());
}
// Преобразует строку с расширенным набором символов
// в строку со стандартными символами.
inline std::string toNative(const XMLCh* str) {
boost::scoped_array ptr(xercesc::XMLString::transcode(str));
return std::string(ptr.get());
}
// Преобразует строку с расширенным набором символов в строку со стандартными символами.
inline std::string toNative(const XercesString& str) {
return toNative(str.c_str());
}
#endif // #ifndef XERCES_STRINGS_HPP_INCLUDED
Для выполнения преобразований между строками Xerces и std::wstring
просто используйте конструктор std::basic_string
, передавая ему два итератора. Например, можно определить следующие две функции.
// Преобразует строку Xerces в строку std::wstring
std::wstring xercesToWstring(const XercesString& str) {
return std::wstring(str.begin(), str.end());
}
// Преобразует строку std::wstring в строку XercesString
XercesString wstringToXerces(const std::wstring& str) {
return XercesString(str.begin(), str.end());
}
В этих функциях используется тот факт, что wchar_t
и XMLCh
являются интегральными типами, каждый из которых может неявно преобразовываться в другой; это должно работать независимо от размера wchar_t
, пока не используются значения, выходящие за диапазон XMLCh
. Вы можете определить подобные функции, принимающие в качестве аргументов строки в C-стиле, используя конструктор std::basic::string
, которому передаются в качестве аргументов массив символов и длина.
Для представления строк в коде Unicode библиотека Xerces использует последовательности символов XMLCh
, завершаемые нулем. Тип XMLCh
вводится с помощью typedef
как интегральный тип, зависящий от реализации и содержащий не менее 16 бит, которых достаточно для представления символов почти любого языка. Xerces применяет символьную кодировку UTF-16, что подразумевает теоретическую возможность представления некоторых символов в коде Unicode в виде последовательности из нескольких символов XMLCh
; однако практически можно считать, что каждый символ XMLCh
непосредственно представляет один символ в коде Unicode, т.е. имеет числовое значение символа Unicode.
Одно время тип XMLCh
определялся с помощью typedef
как wchar_t
, что позволяло легко сохранять копию строки Xerces как std::wstring
. Однако в настоящее время Xerces определяет XMLCh
на всех платформах с помощью typedef
как unsigned short
. Кроме всего прочего это означает, что на некоторых платформах типы XMLCh
и wchar_t
имеют разный размер. Поскольку Xerces может изменить в будущем определение XMLCh
, нельзя рассчитывать на то, что XMLCh
будет идентичен какому-то конкретному типу. Поэтому, если требуется сохранить копию строки Xerces, следует использовать тип std::basic_string
.
При использовании Xerces вам придется часто выполнять преобразования между строками со стандартными символами и строками Xerces; для этой цели в Xerces предусмотрена перегруженная функция transcode()
. transcode()
может преобразовать строку Unicode в строку со стандартными символами, использующую «родную» кодировку символов, или строку с «родной» кодировкой со стандартными символами в строку Unicode. Однако смысл родной кодировки точно не определен, поэтому если вы программируете в среде, в которой часто используется несколько кодировок символов, то вам придется все взять в свои руки и выполнять преобразования особым образом, используя либо фасет std::codecvt
, либо подключаемые службы перекодировки (pluggable transcoding services) библиотеки Xerces, описанные в документации Xerces. Однако во многих случаях вполне достаточно использовать transcode()
.
Память под возвращаемые функцией transcode()
строки, завершающиеся нулем, динамически выделяется при помощи оператора new
в форме массива; вам придется строку удалять самому, используя оператор delete[]
. Это создает небольшую проблему управления памяти, поскольку обычно требуется копировать строку или записывать ее в поток до ее удаления, а эти операции могут выбросить исключение. Я решаю эту проблему в примере 14.4 с помощью шаблона boost::scoped_array
, который динамически выделяет память под массив и автоматически удаляет его при выходе из области видимости, даже если выбрасывается исключение. Например, рассмотрим реализацию функции fromNative
.
inline XercesString fromNative(const char* str) {
boost::scoped_array ptr(xercesc::XMLString::transcode(str));
Интервал:
Закладка: