Почему мой код генерирует ошибку: ожидается одно значение: [экстент = 3]?

Я учусь быть знакомым с пакетом Rcpp, и у меня есть фрейм данных R Д.Ф. со списком столбцов, созданным в два этапа:

df<- data.frame(w= 1:3, x=3:5, y=6:8, z = I(list(1:2, 1:3, 1:4)))

df <- as.data.frame(do.call(cbind, lapply(df[1:3], function(x) Map("*",
df$z, x))))

>df
w                x                  y
1, 2             3, 6              6, 12
2, 4, 6         4, 8, 12          7, 14, 21
3, 6, 9, 12    5, 10, 15, 20      8, 16, 24, 32

Я работаю с набором данных почти 2 миллиона строк. Чтобы сэкономить много времени для удаления, я хочу получить прямой доступ к фрейму данных и выполнить следующую операцию непосредственно с расположением Rcpp, чтобы сгенерировать фрейм данных df1.

df1 <- as.data.frame (4*sin(df*pi))

Основываясь на информации, полученной с этого сайта, я структурировал свой код, который, как я ожидал, смог работать следующим образом:

library(Rcpp)

cppFunction('NumericVector transfo(Rcpp::DataFrame x) {
int nrow = x.nrow(), ncol = x.ncol();
NumericVector out(nrow*ncol);
int pi;
int vol = 4;

for (int j = 0; j < ncol; j++) {
for (int i = 0; i < nrow; i++) {
out[i, j] = sin(x[i,j]*pi)*vol;
}
}
return out;
}')

Но с transfo(df):
Я получаю ошибку:

Expecting a single value: [extent=3].

Я буду благодарен за любой намек на то, где моя ошибка приходит.

-1

Решение

Ваша структура данных очень необычна, и я не уверен, что вы получите много возможностей от использования C ++ здесь. Но вы можете использовать что-то вроде этого:

#include <Rcpp.h>
using namespace Rcpp;

// [[Rcpp::export]]
DataFrame df_sin(DataFrame df) {
R_xlen_t nCols = df.cols();
R_xlen_t nRows = df.rows();
List result(nCols * nRows);
result.attr("dim") = Dimension(nRows, nCols);
colnames(result) = as<CharacterVector>(df.names());

for (R_xlen_t i = 0; i < nCols; ++i) {
List column = as<List>(df[i]);
for (R_xlen_t j = 0; j < nRows; ++j) {
NumericVector tmp = as<NumericVector>(column[j]);
result[i * nCols + j] = 4 * sin(tmp * M_PI);
}
}
DataFrame df1(result);
return df1;
}

/*** R
df <- data.frame(w= 1:3, x=3:5, y=6:8, z = I(list(1:2, 1:3, 1:4)))
df <- as.data.frame(do.call(cbind, lapply(df[1:3],
function(x) Map("*", df$z, x))))
df_sin(df)
*/

Обратите внимание, что я перешел от исходного кода в качестве строкового аргумента к Rcpp::cppFunction() в отдельный .cpp файл. Такой файл может быть легко отредактирован в любом редакторе, который знает о C ++, который включает в себя RStudio. В RStudio вы можете получить исходный файл (Ctrl-Shift-Return или кнопку источника), который скомпилирует и свяжет код. Кроме того, код R в специальном комментарии R в конце будет выполнен. Это удобно, если вам нужен только небольшой код R вместе с кодом C ++. Если код C ++ является частью большей базы кода R, то вы можете вызвать Rcpp::sourceCpp(<cppFile>) в коде R. Это снова скомпилирует и свяжет код, а также сделает экспортированные функции доступными в R. В этом случае, вероятно, легче удалить специальный комментарий R в конце, так как он выполняется при каждом вызове sourceCpp,

2

Другие решения

Других решений пока нет …