Вектор токена, разделенного запятыми, и константного символа **

Я пытаюсь преобразовать строку через запятую в вектор const char *. С помощью следующего кода ожидаемым выводом является

ABC_
DEF
HIJ

но я получаю

HIJ
DEF
HIJ

Куда я иду не так?

Код:

#include <iostream>
#include <boost/tokenizer.hpp>
#include <vector>
#include <string>
using namespace std;

int main()
{
string s("ABC_,DEF,HIJ");
typedef boost::char_separator<char> char_separator;
typedef boost::tokenizer<char_separator> tokenizer;

char_separator comma(",");
tokenizer token(s, comma);
tokenizer::iterator it;

vector<const char*> cStrings;

for(it = token.begin(); it != token.end(); it++)
{
//cout << (*it).c_str() << endl;
cStrings.push_back((*it).c_str());
}

std::vector<const char*>::iterator iv;
for(iv = cStrings.begin(); iv != cStrings.end(); iv++)
{
cout << *iv << endl;
}
return 0;
}

http://ideone.com/3tvnUs

РЕДАКТИРОВАТЬ:
Решение с помощью ответов ниже:
(PaulMcKenzie предлагает более аккуратное решение с использованием списков.)

#include <iostream>
#include <boost/tokenizer.hpp>
#include <vector>
#include <string>
using namespace std;

char* createCopy(std::string s, std::size_t bufferSize)
{
char* value = new char[bufferSize];
memcpy(value, s.c_str(), (bufferSize - 1));
value[bufferSize - 1] = 0;
return value;
}

int main()
{
string s("ABC_,DEF,HIJ");
typedef boost::char_separator<char> char_separator;
typedef boost::tokenizer<char_separator> tokenizer;

char_separator comma(",");
tokenizer token(s, comma);
tokenizer::iterator it;

vector<const char*> cStrings;

for(it = token.begin(); it != token.end(); it++)
{
//cout << it->c_str() << endl;
cStrings.push_back(createCopy(it->c_str(),
(it->length() + 1)));
}

std::vector<const char*>::iterator iv;
for(iv = cStrings.begin(); iv != cStrings.end(); iv++)
{
cout << *iv << endl;
}

//delete allocations by new
//...
return 0;
}

2

Решение

Вот в чем дело: boost::tokenizer::iterator не возвращает вам право собственности на копию строки, но ссылается на внутреннюю копию.

Например, после запуска вашего кода я получаю:

HIJ
HIJ
HIJ

решение состоит в том, чтобы заменить cStrings.push_back((*it).c_str()) с одним из следующих:

    char* c = new char[it->length() + 1];
c[it->length()] = 0;
cStrings.push_back(c);
std::strncpy(c, it->c_str(), it->length());

не выглядит красиво, но вы, вероятно, не получите быстрее, чем это (по крайней мере, если вы хотите использовать boost::tokenizer,

Другой вариант — полностью заменить boost::tokenizer например, с strtok — пример можно найти здесь: C разбить массив символов на разные переменные

Вы также можете использовать boost::algorithm::string::split, но тогда вам может понадобиться переназначить string в const char* позже.

5

Другие решения

Вот метод, который не требует динамического размещения, и в то же время дает вам std :: vector, который вы ищете. Хитрость заключается в том, чтобы создать ваши аргументы в «постоянном» хранилище, а затем просто установить вектор указателей на это хранилище.

Код ниже использует std::list для постоянного хранения. Причина в том, что мы можем гарантировать, что итераторы для элементов в std::list не становятся недействительными, когда мы добавляем элементы в контейнер списка. Это необходимое требование при построении окончательного вектора const char *,

#include <iostream>
#include <boost/tokenizer.hpp>
#include <vector>
#include <string>
#include <list>

typedef std::vector<char> CharArray;
typedef std::list<CharArray> StringList;

using namespace std;

int main()
{
StringList sList;

string s("ABC_,DEF,HIJ");
typedef boost::char_separator<char> char_separator;
typedef boost::tokenizer<char_separator> tokenizer;

char_separator comma(",");
tokenizer token(s, comma);
tokenizer::iterator it;

vector<const char*> cStrings;

for(it = token.begin(); it != token.end(); ++it)
{
// create an array of char and place on list
sList.push_back(CharArray(it->begin(), it->end()));

// null terminate this entry
sList.back().push_back(0);

// add the pointer to this entry to the vector of const char *.
cStrings.push_back(&sList.back()[0]);
}

std::vector<const char*>::iterator iv;
for(iv = cStrings.begin(); iv != cStrings.end(); iv++)
{
cout << *iv << endl;
}
}

Обратите внимание, что нам не нужно динамически выделять память здесь. Единственное, что вам нужно, это убедиться, что StringList не выходит за рамки, так как это где ваши аргументы находятся.

1