SCM

SCM Repository

[matrix] Annotation of /pkg/src/ssclme.c
ViewVC logotype

Annotation of /pkg/src/ssclme.c

Parent Directory Parent Directory | Revision Log Revision Log


Revision 70 - (view) (download) (as text)

1 : bates 10 #include "ssclme.h"
2 :    
3 :     /**
4 :     * Check for a nested series of grouping factors in the sparse,
5 :     * symmetric representation of the pairwise cross-tabulations.
6 :     *
7 :     * @param n size of pairwise cross-tabulation matrix
8 :     * @param nf number of groups of columns in pairwise cross-tabulation
9 :     * @param upper non-zero if the upper triangle is stored
10 :     * @param Ap array of pointers to columns
11 :     * @param Ai row indices
12 :     * @param Gp array of pointers to groups
13 :     *
14 :     * @return 0 for non-nested groups, 1 for nested groups
15 :     */
16 :     static
17 :     int ctab_isNested(int n, int nf, int upper,
18 :     const int Ap[], const int Ai[], const int Gp[])
19 :     {
20 :     if (nf > 1) { /* single factor always nested */
21 :     int i;
22 :     if (upper) {
23 :     int *nnz = (int *) R_alloc(n, sizeof(int)), nz = Ap[n];
24 :     /* count number of nonzeros in each row */
25 :     for (i = 0; i < n; i++) nnz[i] = 0;
26 :     for (i = 0; i < nz; i++) nnz[Ai[i]]++;
27 :     for (i = 0; i < nf; i++) {
28 :     int j, p2 = Gp[i+1], target = nf - i;
29 :     for (j = Gp[i]; j < p2; j++) {
30 :     if (nnz[j] != target) return 0;
31 :     }
32 :     }
33 :     } else { /* lower triangle - the easy case */
34 :     for (i = 0; i < nf; i++) {
35 :     int j, p2 = Gp[i+1], target = nf - i;
36 :     for (j = Gp[i]; j < p2; j++) {
37 :     if ((Ap[j+1] - Ap[j]) != target)
38 :     return 0;
39 :     }
40 :     }
41 :     }
42 :     }
43 :     return 1;
44 :     }
45 :    
46 :     /**
47 :     * Determine if a fill-reducing permutation is needed for the pairwise
48 :     * cross-tabulation matrix. If so, determine such a permutation
49 :     * (using Metis) then separate the groups.
50 :     *
51 :     * @param ctab pointer to a pairwise cross-tabulation object
52 :     *
53 :     * @return pointer to an integer R vector.
54 :     */
55 : bates 70
56 : bates 10 SEXP ctab_permute(SEXP ctab)
57 :     {
58 :     SEXP val, GpSl = GET_SLOT(ctab, Matrix_GpSym);
59 :     int *Ai = INTEGER(GET_SLOT(ctab, Matrix_iSym)),
60 :     *Ap = INTEGER(GET_SLOT(ctab, Matrix_pSym)),
61 :     *Gp = INTEGER(GpSl),
62 :     *perm,
63 :     *work,
64 :     i,
65 :     j,
66 :     n = INTEGER(GET_SLOT(ctab, Matrix_DimSym))[1],
67 :     nf = length(GpSl) - 1,
68 :     pos;
69 :    
70 :     if (ctab_isNested(n, nf, 1, Ap, Ai, Gp))
71 :     return allocVector(INTSXP, 0);
72 :     val = allocVector(INTSXP, n);
73 :     perm = INTEGER(val);
74 :     work = (int *) R_alloc(n, sizeof(int));
75 : bates 70 ssc_metis_order(n, Ap, Ai, work, perm); /* perm gets inverse perm */
76 : bates 10 /* work now contains desired permutation but with groups scrambled */
77 :    
78 :     /* copy work into perm preserving the order of the groups */
79 :     pos = 0; /* position in new permutation */
80 :     for (i = 0; i < nf; i++) {
81 :     for (j = 0; j < n; j++) {
82 :     int jj = work[j];
83 :     if (Gp[i] <= jj && jj < Gp[i+1]) {
84 :     perm[pos] = jj;
85 :     pos++;
86 :     }
87 :     }
88 :     }
89 :     return val;
90 :     }
91 :    
92 :     static
93 :     void ssclme_copy_ctab(int nf, const int nc[], SEXP ctab, SEXP ssc)
94 :     {
95 :     int *snc, i, copyonly = 1;
96 :    
97 :     for (i = 0; i < nf; i++) {
98 :     if (nc[i] > 1) copyonly = 0;
99 :     }
100 :     if (copyonly) {
101 :     SET_SLOT(ssc, Matrix_pSym, duplicate(GET_SLOT(ctab, Matrix_pSym)));
102 :     SET_SLOT(ssc, Matrix_iSym, duplicate(GET_SLOT(ctab, Matrix_iSym)));
103 :     SET_SLOT(ssc, Matrix_xSym, duplicate(GET_SLOT(ctab, Matrix_xSym)));
104 :     SET_SLOT(ssc, Matrix_DimSym,
105 :     duplicate(GET_SLOT(ctab, Matrix_DimSym)));
106 :     SET_SLOT(ssc, Matrix_GpSym, duplicate(GET_SLOT(ctab, Matrix_GpSym)));
107 :     } else {
108 :     int
109 :     *GpIn = INTEGER(GET_SLOT(ctab, Matrix_GpSym)),
110 :     *GpOut,
111 :     *AiIn = INTEGER(GET_SLOT(ctab, Matrix_iSym)),
112 :     *AiOut,
113 :     *ApIn = INTEGER(GET_SLOT(ctab, Matrix_pSym)),
114 :     *ApOut,
115 :     nIn = GpIn[nf], nOut, nzOut,
116 :     *dims,
117 :     *map = Calloc(nIn + 1, int), /* column number map */
118 :     *ncc = Calloc(nIn, int); /* number of columns out for this
119 :     * col in */
120 :    
121 :     SET_SLOT(ssc, Matrix_GpSym, allocVector(INTSXP, nf + 1));
122 :     GpOut = INTEGER(GET_SLOT(ssc, Matrix_GpSym));
123 :     map[0] = GpOut[0] = 0;
124 :     for (i = 0; i < nf; i++) {
125 :     int j, GpIni = GpIn[i], GpInip1 = GpIn[i+1], nci = nc[i];
126 :     GpOut[i+1] = GpOut[i] + (GpInip1 - GpIni) * nci;
127 :     for (j = GpIni; j < GpInip1; j++) {
128 :     ncc[j] = nci;
129 :     map[j+1] = map[j] + nci;
130 :     }
131 :     }
132 :     nOut = GpOut[nf]; /* size of output matrix */
133 :     SET_SLOT(ssc, Matrix_DimSym,
134 :     duplicate(GET_SLOT(ctab, Matrix_DimSym)));
135 :     dims = INTEGER(GET_SLOT(ssc, Matrix_DimSym));
136 :     dims[0] = dims[1] = nOut;
137 :     SET_SLOT(ssc, Matrix_pSym, allocVector(INTSXP, nOut + 1));
138 :     ApOut = INTEGER(GET_SLOT(ssc, Matrix_pSym));
139 :     ApOut[0] = 0;
140 :     for (i = 0; i < nf; i++) { /* determine the column pointers */
141 :     int j, jout = GpOut[i], nci = nc[i], p2 = GpIn[i+1];
142 :     for (j = GpIn[i]; j < p2; j++) {
143 :     int k, nj = 0, p3 = ApIn[j+1];
144 :     for (k = ApIn[j]; k < p3; k++) {
145 :     nj += ncc[AiIn[k]];
146 :     }
147 :     nj -= nci - 1;
148 :     ApOut[jout+1] = ApOut[jout] + nj;
149 :     jout++;
150 :     for (k = 1; k < nci; k++) {
151 :     ApOut[jout+1] = ApOut[jout] + nj + k;
152 :     jout++;
153 :     }
154 :     }
155 :     }
156 :     nzOut = ApOut[nOut]; /* number of non-zeros in output */
157 :     SET_SLOT(ssc, Matrix_xSym, allocVector(REALSXP, nzOut));
158 :     memset(REAL(GET_SLOT(ssc, Matrix_xSym)), 0,
159 :     sizeof(double) * nzOut);
160 :     SET_SLOT(ssc, Matrix_iSym, allocVector(INTSXP, nzOut));
161 :     AiOut = INTEGER(GET_SLOT(ssc, Matrix_iSym));
162 :     for (i = 0; i < nf; i++) { /* fill in the rows */
163 :     int j, jj, nci = nc[i], p2 = GpIn[i+1];
164 :     for (j = GpIn[i]; j < p2; j++) { /* first col for input col */
165 :     int ii = AiIn[j], mj = map[j], ncci = ncc[ii],
166 :     pos = ApOut[mj];
167 :     AiOut[pos++] = map[ii];
168 :     if (ii < j) { /* above the diagonal */
169 :     for (jj = 1; jj < ncci; jj++) {
170 :     AiOut[pos+1] = AiOut[pos] + 1;
171 :     pos++;
172 :     }
173 :     }
174 :     for (jj = 1; jj < nci; jj++) { /* repeat the column adding
175 :     * another diagonal element */
176 :     int mjj = mj + jj, pj = ApOut[mjj], pjm1 = ApOut[mjj-1];
177 :     Memcpy(AiOut + pj, AiOut + pjm1, pj - pjm1);
178 :     AiOut[ApOut[mjj + 1] - 1] = mjj; /* maybe mjj-1? */
179 :     }
180 :     }
181 :     }
182 :     Free(map); Free(ncc);
183 :     }
184 :     SET_SLOT(ssc, Matrix_ncSym, allocVector(INTSXP, nf + 2));
185 :     snc = INTEGER(GET_SLOT(ssc, Matrix_ncSym));
186 :     for (i = 0; i <= nf; i++) {
187 :     snc[i] = nc[i];
188 :     }
189 :     }
190 :    
191 :     static
192 :     void ssclme_fill_LIp(int n, const int Parent[], int LIp[])
193 :     {
194 :     int *sz = Calloc(n, int), i;
195 :     for (i = n - 1; i >= 0; i--) {
196 :     sz[i] = (Parent[i] < 0) ? 0 : 1 + sz[Parent[i]];
197 :     }
198 :     LIp[0] = 0;
199 :     for (i = 0; i < n; i++) LIp[i+1] = LIp[i] + sz[i];
200 :     Free(sz);
201 :     }
202 :    
203 :     static
204 :     void ssclme_fill_LIi(int n, const int Parent[], const int LIp[], int LIi[])
205 :     {
206 :     int i;
207 :     for (i = n; i > 0; i--) {
208 :     int im1 = i - 1, Par = Parent[im1];
209 :     if (Par >= 0) {
210 :     LIi[LIp[im1]] = Par;
211 :     Memcpy(LIi + LIp[im1] + 1, LIi + LIp[Par],
212 :     LIp[Par + 1] - LIp[Par]);
213 :     }
214 :     }
215 :     }
216 :    
217 :     SEXP
218 :     ssclme_create(SEXP facs, SEXP ncv, SEXP threshold)
219 :     {
220 :     SEXP ctab, nms, ssc, tmp,
221 : bates 21 val = PROTECT(allocVector(VECSXP, 2)),
222 :     dd = PROTECT(allocVector(INTSXP, 3)); /* dimensions of 3-D arrays */
223 : bates 10 int *Ai, *Ap, *Gp, *LIp, *Lp, *Parent,
224 : bates 21 *nc, Lnz, i, nf = length(facs), nzcol, pp1,
225 :     *dims = INTEGER(dd);
226 : bates 10
227 :     if (length(ncv) != (nf + 1))
228 :     error("length of nc (%d) should be length of facs (%d) + 1",
229 :     length(ncv), nf);
230 :     SET_VECTOR_ELT(val, 0, NEW_OBJECT(MAKE_CLASS("ssclme")));
231 :     ssc = VECTOR_ELT(val, 0);
232 :     /* Pairwise cross-tabulation */
233 :     ctab = PROTECT(sscCrosstab(facs, ScalarLogical(1)));
234 :     SET_VECTOR_ELT(val, 1, ctab_permute(ctab));
235 :     if (length(VECTOR_ELT(val, 1)) > 0) {/* Fill-reducing permutation */
236 :     ssc_symbolic_permute(INTEGER(GET_SLOT(ctab, Matrix_DimSym))[1],
237 :     1, INTEGER(VECTOR_ELT(val, 1)),
238 :     INTEGER(GET_SLOT(ctab, Matrix_pSym)),
239 :     INTEGER(GET_SLOT(ctab, Matrix_iSym)));
240 :     }
241 :     ssclme_copy_ctab(nf, INTEGER(ncv), ctab, ssc);
242 :     UNPROTECT(1); /* ctab */
243 :    
244 :     nzcol = INTEGER(GET_SLOT(ssc, Matrix_DimSym))[1];
245 :     Gp = INTEGER(GET_SLOT(ssc, Matrix_GpSym));
246 :     Ap = INTEGER(GET_SLOT(ssc, Matrix_pSym));
247 :     Ai = INTEGER(GET_SLOT(ssc, Matrix_iSym));
248 :     nc = INTEGER(GET_SLOT(ssc, Matrix_ncSym));
249 :     nc[nf + 1] = length(VECTOR_ELT(facs, 0)); /* number of observations */
250 :     /* Create slots */
251 :     pp1 = nc[nf];
252 :     SET_SLOT(ssc, Matrix_XtXSym, allocMatrix(REALSXP, pp1, pp1));
253 :     SET_SLOT(ssc, Matrix_RXXSym, allocMatrix(REALSXP, pp1, pp1));
254 :     SET_SLOT(ssc, Matrix_ZtXSym, allocMatrix(REALSXP, nzcol, pp1));
255 :     SET_SLOT(ssc, Matrix_RZXSym, allocMatrix(REALSXP, nzcol, pp1));
256 :     /* Zero the symmetric matrices (for cosmetic reasons only). */
257 :     memset(REAL(GET_SLOT(ssc, Matrix_XtXSym)), 0,
258 :     sizeof(double) * pp1 * pp1);
259 :     memset(REAL(GET_SLOT(ssc, Matrix_RXXSym)), 0,
260 :     sizeof(double) * pp1 * pp1);
261 :     SET_SLOT(ssc, Matrix_LpSym, allocVector(INTSXP, nzcol + 1));
262 :     Lp = INTEGER(GET_SLOT(ssc, Matrix_LpSym));
263 :     SET_SLOT(ssc, Matrix_ParentSym, allocVector(INTSXP, nzcol));
264 :     Parent = INTEGER(GET_SLOT(ssc, Matrix_ParentSym));
265 :     SET_SLOT(ssc, Matrix_DSym, allocVector(REALSXP, nzcol));
266 :     SET_SLOT(ssc, Matrix_DIsqrtSym, allocVector(REALSXP, nzcol));
267 :     ldl_symbolic(nzcol, Ap, Ai, Lp, Parent,
268 :     (int *) R_alloc(nzcol, sizeof(int)), /* Lnz */
269 :     (int *) R_alloc(nzcol, sizeof(int)), /* Flag */
270 :     (int *) NULL, (int *) NULL); /* P & Pinv */
271 :     Lnz = Lp[nzcol];
272 :     SET_SLOT(ssc, Matrix_LiSym, allocVector(INTSXP, Lnz));
273 :     SET_SLOT(ssc, Matrix_LxSym, allocVector(REALSXP, Lnz));
274 :     SET_SLOT(ssc, Matrix_OmegaSym, allocVector(VECSXP, nf));
275 :     tmp = GET_SLOT(ssc, Matrix_OmegaSym);
276 :     setAttrib(tmp, R_NamesSymbol, getAttrib(facs, R_NamesSymbol));
277 :     for (i = 0; i < nf; i++) {
278 :     SET_VECTOR_ELT(tmp, i, allocMatrix(REALSXP, nc[i], nc[i]));
279 :     memset(REAL(VECTOR_ELT(tmp, i)), 0,
280 :     sizeof(double) * nc[i] * nc[i]);
281 :     }
282 :     SET_SLOT(ssc, Matrix_devianceSym, allocVector(REALSXP, 2));
283 :     tmp = GET_SLOT(ssc, Matrix_devianceSym);
284 :     setAttrib(tmp, R_NamesSymbol, allocVector(STRSXP, 2));
285 :     nms = getAttrib(tmp, R_NamesSymbol);
286 :     SET_STRING_ELT(nms, 0, mkChar("ML"));
287 :     SET_STRING_ELT(nms, 1, mkChar("REML"));
288 :     SET_SLOT(ssc, Matrix_devCompSym, allocVector(REALSXP, 4));
289 :     SET_SLOT(ssc, Matrix_statusSym, allocVector(LGLSXP, 2));
290 :     tmp = GET_SLOT(ssc, Matrix_statusSym);
291 :     LOGICAL(tmp)[0] = LOGICAL(tmp)[1] = 0;
292 :     setAttrib(tmp, R_NamesSymbol, allocVector(STRSXP, 2));
293 :     nms = getAttrib(tmp, R_NamesSymbol);
294 :     SET_STRING_ELT(nms, 0, mkChar("factored"));
295 :     SET_STRING_ELT(nms, 1, mkChar("inverted"));
296 :     SET_SLOT(ssc, Matrix_bVarSym, allocVector(VECSXP, nf));
297 :     tmp = GET_SLOT(ssc, Matrix_bVarSym);
298 :     setAttrib(tmp, R_NamesSymbol, getAttrib(facs, R_NamesSymbol));
299 :     for (i = 0; i < nf; i++) {
300 : bates 21 int nci = nc[i], mi = (Gp[i+1] - Gp[i])/nc[i];
301 : bates 10
302 : bates 21 dims[0] = dims[1] = nci;
303 :     dims[2] = mi;
304 :     SET_VECTOR_ELT(tmp, i, allocArray(REALSXP, dd));
305 : bates 10 memset(REAL(VECTOR_ELT(tmp, i)), 0,
306 : bates 21 sizeof(double) * nci * nci * mi);
307 : bates 10 }
308 :     SET_SLOT(ssc, Matrix_LIpSym, allocVector(INTSXP, nzcol + 1));
309 :     LIp = INTEGER(GET_SLOT(ssc, Matrix_LIpSym));
310 :     ssclme_fill_LIp(nzcol, Parent, LIp);
311 :     if (asInteger(threshold) > (Lnz = LIp[nzcol])) {
312 :     SET_SLOT(ssc, Matrix_LIiSym, allocVector(INTSXP, Lnz));
313 :     ssclme_fill_LIi(nzcol, Parent, LIp,
314 :     INTEGER(GET_SLOT(ssc, Matrix_LIiSym)));
315 :     SET_SLOT(ssc, Matrix_LIxSym, allocVector(REALSXP, Lnz));
316 :     memset(REAL(GET_SLOT(ssc, Matrix_LIxSym)), 0,
317 :     sizeof(double) * Lnz);
318 :     }
319 : bates 21 UNPROTECT(2);
320 : bates 10 return val;
321 :     }
322 :    
323 :     static
324 :     void bVj_to_A(int ncj, int Gpj, int Gpjp, const double bVj[],
325 :     const int Ap[], const int Ai[], double Ax[])
326 :     {
327 :     int i, diag, k;
328 :     for (i = Gpj; i < Gpjp; i += ncj) {
329 :     for (k = 0; k < ncj; k++) {
330 :     diag = Ap[i + k + 1] - 1;
331 :     if (Ai[diag] != i+k)
332 :     error("Expected Ai[%d] to be %d (i.e on diagonal) not %d",
333 :     diag, i+k, Ai[diag]);
334 :     Memcpy(Ax + diag - k, bVj + (i+k-Gpj)*ncj, k + 1);
335 :     }
336 :     }
337 :     }
338 :    
339 :     SEXP
340 : bates 22 ssclme_transfer_dimnames(SEXP x, SEXP facs, SEXP mmats)
341 :     {
342 :     SEXP bVar = GET_SLOT(x, Matrix_bVarSym),
343 :     nms2 = PROTECT(allocVector(VECSXP, 2)),
344 :     nms3 = PROTECT(allocVector(VECSXP, 3));
345 :     int i, nf = length(mmats) - 1;
346 :     SEXP xcols = VECTOR_ELT(GetArrayDimnames(VECTOR_ELT(mmats, nf)), 1);
347 :    
348 :     for (i = 0; i < nf; i++) {
349 :     SEXP cnms = VECTOR_ELT(GetArrayDimnames(VECTOR_ELT(mmats, i)), 1);
350 :     SET_VECTOR_ELT(nms3, 0, cnms);
351 :     SET_VECTOR_ELT(nms3, 1, cnms);
352 :     SET_VECTOR_ELT(nms3, 2,
353 :     getAttrib(VECTOR_ELT(facs, i), R_LevelsSymbol));
354 :     dimnamesgets(VECTOR_ELT(bVar, i), duplicate(nms3));
355 :     }
356 :     SET_VECTOR_ELT(nms2, 0, xcols);
357 :     SET_VECTOR_ELT(nms2, 1, xcols);
358 :     dimnamesgets(GET_SLOT(x, Matrix_XtXSym), nms2);
359 :     dimnamesgets(GET_SLOT(x, Matrix_RXXSym), nms2);
360 :     UNPROTECT(2);
361 :     return R_NilValue;
362 :     }
363 :    
364 :     SEXP
365 : bates 10 ssclme_update_mm(SEXP x, SEXP facs, SEXP mmats)
366 :     {
367 : bates 22 SEXP bVar = GET_SLOT(x, Matrix_bVarSym);
368 : bates 10 int
369 :     *Ai = INTEGER(GET_SLOT(x, Matrix_iSym)),
370 :     *Ap = INTEGER(GET_SLOT(x, Matrix_pSym)),
371 :     *Gp = INTEGER(GET_SLOT(x, Matrix_GpSym)),
372 :     *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
373 :     i, j, k,
374 :     ione = 1,
375 :     nf = length(mmats) - 1,
376 :     nobs = nc[nf + 1],
377 :     nzcol = Gp[nf],
378 :     nz = Ap[nzcol],
379 :     pp1 = nc[nf];
380 :     double
381 :     **Z = Calloc(nf + 1, double *),
382 :     *Ax = REAL(GET_SLOT(x, Matrix_xSym)),
383 :     *XtX = REAL(GET_SLOT(x, Matrix_XtXSym)),
384 :     *ZtX = REAL(GET_SLOT(x, Matrix_ZtXSym)),
385 :     one = 1.0,
386 :     zero = 0.0;
387 :    
388 :     for (i = 0; i <= nf; i++) {
389 :     int *dims = INTEGER(getAttrib(VECTOR_ELT(mmats, i), R_DimSymbol)),
390 :     nci = nc[i];
391 :     if (nobs != dims[0])
392 :     error("Expected %d rows in the %d'th model matrix. Got %d",
393 :     nobs, i+1, dims[0]);
394 :     if (nci != dims[1])
395 :     error("Expected %d columns in the %d'th model matrix. Got %d",
396 :     nci, i+1, dims[1]);
397 :     Z[i] = REAL(VECTOR_ELT(mmats, i));
398 :     }
399 :     /* Create XtX - X is Z[nf] */
400 :     F77_CALL(dsyrk)("U", "T", nc+nf, &nobs, &one,
401 :     Z[nf], &nobs, &zero, XtX, nc + nf);
402 :     /* Zero the accumulators */
403 :     memset((void *) ZtX, 0, sizeof(double) * nzcol * pp1);
404 :     memset((void *) Ax, 0, sizeof(double) * nz);
405 :     for (j = 0; j < nf; j++) { /* Create ZtX */
406 :     int *fpj = INTEGER(VECTOR_ELT(facs, j)), ncj = nc[j],
407 :     Ncj = ncj > 1;
408 :     double
409 :     *bVj = REAL(VECTOR_ELT(bVar, j)),
410 :     *Zj = Z[j],
411 :     *zxj = ZtX + Gp[j];
412 :    
413 :     if (Ncj) { /* bVj will accumulate Z'Z blocks */
414 :     memset(bVj, 0, sizeof(double) * ncj * (Gp[j+1]-Gp[j]));
415 :     }
416 :     for (i = 0; i < nobs; i++) { /* accumulate diagonal of ZtZ */
417 :     int fpji = fpj[i] - 1, /* factor indices are 1-based */
418 :     dind = Ap[Gp[j] + fpji * ncj + 1] - 1;
419 :     if (Ai[dind] != (Gp[j] + fpji * ncj))
420 :     error("logic error in ssclme_update_mm");
421 :     if (Ncj) { /* use bVar to accumulate */
422 :     F77_CALL(dsyrk)("U", "T", &ncj, &ione, &one, Zj+i,
423 :     &nobs, &one, bVj + fpji*ncj*ncj, &ncj);
424 :     } else { /* update scalars directly */
425 :     Ax[dind] += Zj[i] * Zj[i];
426 :     }
427 :     /* update rows of Z'X */
428 :     F77_CALL(dgemm)("T", "N", &ncj, &pp1, &ione, &one,
429 :     Zj + i, &nobs, Z[nf] + i, &nobs,
430 :     &one, zxj + fpji * ncj, &nzcol);
431 :     }
432 :     if (Ncj) bVj_to_A(ncj, Gp[j], Gp[j+1], bVj, Ap, Ai, Ax);
433 :     for (k = j+1; k < nf; k++) { /* off-diagonals */
434 :     int *fpk = INTEGER(VECTOR_ELT(facs, k)),
435 :     *Apk = Ap + Gp[k],
436 :     nck = nc[k];
437 :     double
438 :     *Zk = Z[k];
439 :    
440 :     for (i = 0; i < nobs; i++) {
441 :     int ii, ind = -1, fpji = fpj[i] - 1,
442 :     row = Gp[j] + fpji * ncj,
443 :     fpki = fpk[i] - 1,
444 :     lastind = Apk[fpki + 1];
445 :     for (ii = Apk[fpki]; ii < lastind; ii++) {
446 :     if (Ai[ii] == row) {
447 :     ind = ii;
448 :     break;
449 :     }
450 :     }
451 :     if (ind < 0) error("logic error in ssclme_update_mm");
452 :     if (Ncj || nck > 1) {
453 :     /* FIXME: run a loop to update */
454 : bates 22 error("code not yet written");
455 : bates 10 } else { /* update scalars directly */
456 :     Ax[ind] += Zj[fpji] * Zk[fpki];
457 :     }
458 :     }
459 :     }
460 :     }
461 :     Free(Z);
462 : bates 22 ssclme_transfer_dimnames(x, facs, mmats);
463 : bates 10 return R_NilValue;
464 :     }
465 :    
466 :     SEXP ssclme_inflate_and_factor(SEXP lme)
467 :     {
468 :     SEXP
469 :     GpSlot = GET_SLOT(lme, Matrix_GpSym),
470 :     Omega = GET_SLOT(lme, Matrix_OmegaSym);
471 :     int n = INTEGER(GET_SLOT(lme, Matrix_DimSym))[1];
472 :     int
473 :     *Ai = INTEGER(GET_SLOT(lme, Matrix_iSym)),
474 :     *Ap = INTEGER(GET_SLOT(lme, Matrix_pSym)),
475 :     *Flag = Calloc(n, int),
476 :     *Gp = INTEGER(GpSlot),
477 :     *Lnz = Calloc(n, int),
478 :     *Pattern = Calloc(n, int),
479 :     *nc = INTEGER(GET_SLOT(lme, Matrix_ncSym)),
480 :     j,
481 :     nf = length(GpSlot) - 1;
482 :     double
483 :     *D = REAL(GET_SLOT(lme, Matrix_DSym)),
484 :     *DIsqrt = REAL(GET_SLOT(lme, Matrix_DIsqrtSym)),
485 :     *Y = Calloc(n, double),
486 :     *xcp = Calloc(Ap[n], double);
487 :    
488 :     Memcpy(xcp, REAL(GET_SLOT(lme, Matrix_xSym)), Ap[n]);
489 :     for (j = 0; j < nf; j++) {
490 :     int diag, i, ii, k, G2 = Gp[j + 1], ncj = nc[j];
491 :     double *omgj = REAL(VECTOR_ELT(Omega, j));
492 :    
493 :     for (i = Gp[j]; i < G2; i += ncj) {
494 :     for (k = 0; k < ncj; k++) {
495 :     diag = Ap[i + k + 1] - 1;
496 :     if (Ai[diag] != i+k)
497 :     error("Expected Ai[%d] to be %d (i.e on diagonal) not %d",
498 :     diag, i+k, Ai[diag]);
499 :     for (ii = 0; ii <= k; ii++) {
500 :     xcp[diag + ii - k] += omgj[k*ncj + ii];
501 :     }
502 :     }
503 :     }
504 :     }
505 :     j = ldl_numeric(n, Ap, Ai, xcp,
506 :     INTEGER(GET_SLOT(lme, Matrix_LpSym)),
507 :     INTEGER(GET_SLOT(lme, Matrix_ParentSym)),
508 :     Lnz, INTEGER(GET_SLOT(lme, Matrix_LiSym)),
509 :     REAL(GET_SLOT(lme, Matrix_LxSym)),
510 :     D, Y, Pattern, Flag,
511 :     (int *) NULL, (int *) NULL); /* P & Pinv */
512 :     if (j != n)
513 :     error("rank deficiency of ZtZ+W detected at column %d",
514 :     j + 1);
515 :     for (j = 0; j < n; j++) DIsqrt[j] = 1./sqrt(D[j]);
516 :     Free(Lnz); Free(Flag); Free(Pattern); Free(Y); Free(xcp);
517 :     return R_NilValue;
518 :     }
519 :    
520 :     SEXP ssclme_factor(SEXP lme)
521 :     {
522 :     int *status = LOGICAL(GET_SLOT(lme, Matrix_statusSym));
523 :    
524 :     if (!status[0]) {
525 :     SEXP
526 :     GpSlot = GET_SLOT(lme, Matrix_GpSym),
527 :     Omega = GET_SLOT(lme, Matrix_OmegaSym);
528 :     int
529 :     *Gp = INTEGER(GpSlot),
530 :     *Li = INTEGER(GET_SLOT(lme, Matrix_LiSym)),
531 :     *Lp = INTEGER(GET_SLOT(lme, Matrix_LpSym)),
532 :     *nc = INTEGER(GET_SLOT(lme, Matrix_ncSym)),
533 :     i,
534 :     n = INTEGER(GET_SLOT(lme, Matrix_DimSym))[1],
535 :     nf = length(GpSlot) - 1,
536 :     nobs = nc[nf + 1],
537 :     nreml = nobs + 1 - nc[nf],
538 :     pp1 = nc[nf],
539 :     pp2 = pp1 + 1;
540 :     double
541 :     *D = REAL(GET_SLOT(lme, Matrix_DSym)),
542 :     *DIsqrt = REAL(GET_SLOT(lme, Matrix_DIsqrtSym)),
543 :     *Lx = REAL(GET_SLOT(lme, Matrix_LxSym)),
544 :     *RXX = REAL(GET_SLOT(lme, Matrix_RXXSym)),
545 :     *RZX = REAL(GET_SLOT(lme, Matrix_RZXSym)),
546 :     *dcmp = REAL(getAttrib(lme, Matrix_devCompSym)),
547 :     *deviance = REAL(getAttrib(lme, Matrix_devianceSym)),
548 :     minus1 = -1.,
549 :     one = 1.;
550 :    
551 :     ssclme_inflate_and_factor(lme);
552 :     /* Accumulate logdet of ZtZ+W */
553 :     dcmp[0] = dcmp[1] = dcmp[2] = dcmp[3] = 0.;
554 :     for (i = 0; i < n; i++) dcmp[0] += log(D[i]);
555 :     /* Accumulate logdet of W */
556 :     for (i = 0; i < nf; i++) {
557 :     int nci = nc[i],
558 :     mi = (Gp[i+1] - Gp[i])/nci;
559 :    
560 :     if (nci < 2) {
561 :     dcmp[1] += mi * log(REAL(VECTOR_ELT(Omega, i))[0]);
562 :     } else {
563 :     int j;
564 :     double
565 :     *tmp = Calloc(nci * nci, double),
566 :     accum = 0.;
567 :     F77_CALL(dpotrf)("U", &nci,
568 :     Memcpy(tmp, REAL(VECTOR_ELT(Omega, i)),
569 :     nci * nci),
570 :     &nci, &j);
571 :     if (j)
572 :     error("Omega[%d] is not positive definite", i + 1);
573 :     for (j = 0; j < nci; j++) {
574 :     accum += 2 * log(tmp[j * (nci + 1)]);
575 :     }
576 :     dcmp[1] += mi * accum;
577 :     Free(tmp);
578 :     }
579 :     }
580 :     /* ldl_lsolve on Z'X */
581 :     Memcpy(RZX, REAL(GET_SLOT(lme, Matrix_ZtXSym)), n * pp1);
582 :     for (i = 0; i < pp1; i++) {
583 :     int j;
584 :     double *RZXi = RZX + i * n;
585 :     ldl_lsolve(n, RZXi, Lp, Li, Lx);
586 :     for (j = 0; j < n; j++) RZXi[j] *= DIsqrt[j];
587 :     }
588 :     /* downdate and factor X'X */
589 :     Memcpy(RXX, REAL(GET_SLOT(lme, Matrix_XtXSym)), pp1 * pp1);
590 :     F77_CALL(dsyrk)("U", "T", &pp1, &n, &minus1,
591 :     RZX, &n, &one, RXX, &pp1);
592 :     F77_CALL(dpotrf)("U", &pp1, RXX, &pp1, &i);
593 :     if (i)
594 :     error("DPOTRF returned error code %d", i);
595 :     /* logdet of RXX */
596 :     for (i = 0; i < (pp1 - 1); i++)
597 :     dcmp[2] += 2 * log(RXX[i*pp2]);
598 :     /* logdet of Ryy */
599 :     dcmp[3] = 2. * log(RXX[pp1 * pp1 - 1]);
600 :     deviance[0] = /* ML criterion */
601 :     dcmp[0] - dcmp[1] + nobs*(1+dcmp[3]+log(2*PI/nobs));
602 :     deviance[1] = dcmp[0] - dcmp[1] + /* REML */
603 :     dcmp[2] + nreml * (1. + dcmp[3] + log(2. * PI/nreml));
604 :     status[0] = 1;
605 :     status[1] = 0;
606 :     }
607 :     return R_NilValue;
608 :     }
609 :    
610 :     static
611 :     int ldl_update_ind(int probe, int start, const int ind[])
612 :     {
613 :     while (ind[start] < probe) start++;
614 :     if (ind[start] > probe) error("logic error in ldl_inverse");
615 :     return start;
616 :     }
617 :    
618 :     /**
619 :     * Create the inverse of L and update the diagonal blocks of the inverse
620 :     * of LDL' (=Z'Z+W)
621 :     *
622 :     * @param x pointer to an ssclme object
623 :     *
624 :     * @return R_NilValue (x is updated in place)
625 :    
626 :     */
627 :     SEXP ldl_inverse(SEXP x)
628 :     {
629 :     SEXP
630 :     Gpsl = GET_SLOT(x, Matrix_GpSym),
631 :     LIisl = GET_SLOT(x, Matrix_LIiSym),
632 :     LIpsl = GET_SLOT(x, Matrix_LIpSym),
633 :     bVar = GET_SLOT(x, Matrix_bVarSym);
634 :     int *Gp = INTEGER(Gpsl),
635 :     *Li,
636 :     *LIp = INTEGER(LIpsl), *Lp,
637 :     i,
638 :     nf = length(Gpsl) - 1,
639 :     nzc = length(LIpsl) - 1;
640 :     double
641 :     *DIsqrt = REAL(GET_SLOT(x, Matrix_DIsqrtSym)),
642 :     *Lx;
643 :    
644 :     ssclme_factor(x);
645 :     if (LIp[nzc] == 0) { /* L and LI are the identity */
646 :     for (i = 0; i < nf; i++) {
647 :     Memcpy(REAL(VECTOR_ELT(bVar, i)), DIsqrt + Gp[i],
648 :     Gp[i+1] - Gp[i]);
649 :     }
650 :     return R_NilValue;
651 :     }
652 :     Lp = INTEGER(GET_SLOT(x, Matrix_LpSym));
653 :     Li = INTEGER(GET_SLOT(x, Matrix_LiSym));
654 :     Lx = REAL(GET_SLOT(x, Matrix_LxSym));
655 :     if (length(LIisl) == LIp[nzc]) { /* LIi is filled */
656 :     int *LIi = INTEGER(LIisl),
657 :     *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
658 :     j, jj, k, kk, p1, p2, pi1, pi2;
659 :    
660 :     double *LIx = REAL(GET_SLOT(x, Matrix_LIxSym)),
661 :     one = 1., zero = 0.;
662 :    
663 :     memset(LIx, 0, sizeof(double) * LIp[nzc]);
664 :     /* calculate inverse */
665 :     for (i = 0; i < nzc; i++) {
666 :     p1 = Lp[i]; p2 = Lp[i+1]; pi1 = LIp[i]; pi2 = LIp[i+1];
667 :     /* initialize from unit diagonal term */
668 :     kk = pi1;
669 :     for (j = p1; j < p2; j++) {
670 :     k = Li[j];
671 :     while (LIi[kk] < k && kk < pi2) kk++;
672 :     if (LIi[kk] != k) error("logic error in ldl_inverse");
673 :     LIx[kk] = -Lx[j];
674 :     }
675 :     for (j = pi1; j < pi2; j++) {
676 :     jj = LIi[j];
677 :     p1 = Lp[jj]; p2 = Lp[jj+1];
678 :     kk = j;
679 :     for (jj = p1; jj < p2; jj++) {
680 :     k = Li[jj];
681 :     while (LIi[kk] < k && kk < pi2) kk++;
682 :     if (LIi[kk] != k) error("logic error in ldl_inverse");
683 :     LIx[kk] -= Lx[jj]*LIx[j];
684 :     }
685 :     }
686 :     }
687 :     for (i = 0; i < nf; i++) { /* accumulate bVar */
688 :     int G1 = Gp[i], G2 = Gp[i+1], j, k, kk,
689 :     nci = nc[i], nr, nr1, rr;
690 :     double *bVi = REAL(VECTOR_ELT(bVar, i)), *tmp;
691 :    
692 :     nr = -1;
693 :     for (j = G1; j < G2; j += nci) {
694 :     rr = 1 + LIp[j + 1] - LIp[j];
695 :     if (rr > nr) nr = rr;
696 :     }
697 :     tmp = Calloc(nr * nci, double); /* scratch storage */
698 :     nr1 = nr + 1;
699 :     /* initialize bVi to zero (cosmetic) */
700 :     memset(bVi, 0, sizeof(double) * (G2 - G1) * nci);
701 :     for (j = G1; j < G2; j += nci) {
702 :     memset(tmp, 0, sizeof(double) * nr * nci);
703 :     rr = 1 + LIp[j + 1] - LIp[j];
704 :     for (k = 0; k < nci; k++) { /* copy columns */
705 :     tmp[k * nr1] = 1.; /* (unstored) diagonal elt */
706 :     Memcpy(tmp + k*nr1 + 1, LIx + LIp[j + k], rr - k - 1);
707 :     }
708 :     /* scale the rows */
709 :     tmp[0] = DIsqrt[j]; /* first row only has one non-zero */
710 :     for (kk = 1; kk < rr; kk++) {
711 :     for (k = 0; k < nci; k++) {
712 :     tmp[k * nr + kk] *= DIsqrt[LIi[LIp[j] + kk - 1]];
713 :     }
714 :     }
715 :     F77_CALL(dsyrk)("U", "T", &nci, &rr, &one, tmp, &nr,
716 :     &zero, bVi + (j - G1) * nci, &nci);
717 :     F77_CALL(dpotrf)("U", &nci, bVi + (j - G1) * nci,
718 :     &nci, &kk);
719 :     if (kk) /* should never happen */
720 :     error(
721 :     "Rank deficient variance matrix at group %d, level %d",
722 :     i + 1, j + 1);
723 :     }
724 :     }
725 :     return R_NilValue;
726 :     }
727 :     if (length(LIisl)) error("logic error in ssclme_ldl_inverse");
728 :     else { /* LIi and LIx are too big and not used */
729 :     int *counts = Calloc(nzc, int), info, maxod = -1;
730 :     int *Parent = INTEGER(GET_SLOT(x, Matrix_ParentSym));
731 :     int *nc = INTEGER(GET_SLOT(x, Matrix_ncSym));
732 :     double one = 1.0, zero = 0.;
733 :     /* determine maximum # of off-diagonals */
734 :     for (i = nzc - 1; i >= 0; i--) { /* in a column of L^{-1} */
735 :     counts[i] = (Parent[i] < 0) ? 0 : 1 + counts[Parent[i]];
736 :     if (counts[i] > maxod) maxod = counts[i];
737 :     }
738 :     Free(counts);
739 :    
740 :     for (i = 0; i < nf; i++) {
741 :     int j, jj, k, kk, nci = nc[i], nr, p, p2, pp,
742 :     m = maxod + nci,
743 :     *ind = Calloc(m, int);
744 :     double
745 :     *tmp = Calloc(m * nci, double),
746 :     *mpt = REAL(VECTOR_ELT(bVar, i));
747 :    
748 :     for (j = Gp[i]; j < Gp[i+1]; j += nci) {
749 :     memset((void *) tmp, 0, sizeof(double) * m * nci);
750 :    
751 :     kk = 0; /* ind holds indices of non-zeros */
752 :     jj = j; /* in this block of columns */
753 :     while (jj >= 0) {
754 :     ind[kk++] = jj;
755 :     jj = Parent[jj];
756 :     }
757 :     nr = kk; /* number of non-zeros in this block */
758 :     while (kk < m) ind[kk++] = nzc; /* placeholders */
759 :    
760 :     for (k = 0; k < nci; k++) {
761 :     double *ccol = tmp + k * nr;
762 :    
763 :     ccol[k] = 1.;
764 :     kk = k;
765 :     for (jj = j + k; jj >= 0; jj = Parent[jj]) {
766 :     p2 = Lp[jj+1];
767 :     pp = kk;
768 :     for (p = Lp[jj]; p < p2; p++) {
769 :     pp = ldl_update_ind(Li[p], pp, ind);
770 :     ccol[pp] -= Lx[p] * ccol[kk];
771 :     }
772 :     }
773 :     }
774 :     /* scale rows */
775 :     for (kk = 0; kk < nr; kk++) {
776 :     for (k = 0; k < nci; k++) {
777 :     tmp[k * nr + kk] *= DIsqrt[ind[kk]];
778 :     }
779 :     }
780 :     F77_CALL(dsyrk)("U", "T", &nci, &nr, &one, tmp, &nr,
781 :     &zero, mpt + (j - Gp[i])*nci, &nci);
782 :     F77_CALL(dpotrf)("U", &nci, mpt + (j - Gp[i])*nci,
783 :     &nci, &info);
784 :     if (info) /* should never happen */
785 :     error(
786 :     "Rank deficient variance matrix at group %d, level %d",
787 :     i + 1, j + 1);
788 :     }
789 :     Free(tmp); Free(ind);
790 :     }
791 :     }
792 :     return R_NilValue;
793 :     }
794 :    
795 :     SEXP ssclme_invert(SEXP lme)
796 :     {
797 :     int *status = LOGICAL(GET_SLOT(lme, Matrix_statusSym));
798 :     if (!status[0]) ssclme_factor(lme);
799 :     if (!status[1]) {
800 :     SEXP
801 :     RZXsl = GET_SLOT(lme, Matrix_RZXSym);
802 :     int
803 :     *dims = INTEGER(getAttrib(RZXsl, R_DimSymbol)),
804 :     *Li = INTEGER(GET_SLOT(lme, Matrix_LiSym)),
805 :     *Lp = INTEGER(GET_SLOT(lme, Matrix_LpSym)),
806 :     i,
807 :     n = dims[0],
808 :     pp1 = dims[1];
809 :     double
810 :     *DIsqrt = REAL(GET_SLOT(lme, Matrix_DIsqrtSym)),
811 :     *Lx = REAL(GET_SLOT(lme, Matrix_LxSym)),
812 :     *RXX = REAL(GET_SLOT(lme, Matrix_RXXSym)),
813 :     *RZX = REAL(RZXsl),
814 :     one = 1.;
815 :    
816 :     F77_CALL(dtrtri)("U", "N", &pp1, RXX, &pp1, &i);
817 :     if (i)
818 :     error("DTRTRI returned error code %d", i);
819 :     F77_CALL(dtrmm)("R", "U", "N", "N", &n, &pp1, &one,
820 :     RXX, &pp1, RZX, &n);
821 :     for (i = 0; i < pp1; i++) {
822 :     int j; double *RZXi = RZX + i * n;
823 :     for (j = 0; j < n; j++) RZXi[j] *= DIsqrt[j];
824 :     ldl_ltsolve(n, RZXi, Lp, Li, Lx);
825 :     }
826 :     ldl_inverse(lme);
827 :     status[1] = 1;
828 :     }
829 :     return R_NilValue;
830 :     }
831 :    
832 :     SEXP ssclme_initial(SEXP x)
833 :     {
834 :     SEXP Gpsl = GET_SLOT(x, Matrix_GpSym),
835 :     Omg = GET_SLOT(x, Matrix_OmegaSym);
836 :     int *Ai = INTEGER(GET_SLOT(x, Matrix_iSym)),
837 :     *Ap = INTEGER(GET_SLOT(x, Matrix_pSym)),
838 :     *Gp = INTEGER(Gpsl),
839 :     *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
840 :     *status = LOGICAL(GET_SLOT(x, Matrix_statusSym)),
841 :     i, nf = length(Gpsl) - 1;
842 :    
843 :     double *Ax = REAL(GET_SLOT(x, Matrix_xSym));
844 :    
845 :     for (i = 0; i < nf; i++) {
846 :     int
847 :     Gpi = Gp[i],
848 :     j, k,
849 :     nci = nc[i],
850 :     ncip1 = nci + 1,
851 :     p2 = Gp[i+1];
852 :     double
853 :     mi = 0.375 * ((double) nci)/((double) (p2 - Gpi)),
854 :     *mm = REAL(VECTOR_ELT(Omg, i));
855 :    
856 :     memset((void *) mm, 0, sizeof(double) * nci * nci);
857 :     for (j = Gpi; j < p2; j += nci) {
858 :     for (k = 0; k < nci; k++) {
859 :     int jk = j+k, jj = Ap[jk+1] - 1;
860 :     if (Ai[jj] != jk) error("malformed ZtZ structure");
861 :     mm[k * ncip1] += Ax[jj] * mi;
862 :     }
863 :     }
864 :     }
865 :     status[0] = status[1] = 0;
866 :     return R_NilValue;
867 :     }
868 :    
869 :     /**
870 :     * Extract the conditional estimates of the fixed effects
871 :     * FIXME: Add names
872 :     *
873 :     * @param x Pointer to an ssclme object
874 :     *
875 :     * @return a numeric vector containing the conditional estimates of
876 :     * the fixed effects
877 :     */
878 :     SEXP ssclme_fixef(SEXP x)
879 :     {
880 :     SEXP RXXsl = GET_SLOT(x, Matrix_RXXSym);
881 :     int pp1 = INTEGER(getAttrib(RXXsl, R_DimSymbol))[1];
882 :     int j, p = pp1 - 1;
883 :     SEXP val = PROTECT(allocVector(REALSXP, p));
884 :     double
885 :     *RXX = REAL(RXXsl),
886 :     *beta = REAL(val),
887 :     nryyinv; /* negative ryy-inverse */
888 :    
889 :     ssclme_invert(x);
890 :     Memcpy(beta, RXX + p * pp1, p);
891 :     nryyinv = -RXX[pp1*pp1 - 1];
892 :     for (j = 0; j < p; j++) beta[j] /= nryyinv;
893 :     UNPROTECT(1);
894 :     return val;
895 :     }
896 :    
897 :     /**
898 :     * Extract the conditional modes of the random effects.
899 :     * FIXME: Change the returned value to be a named list of matrices
900 :     * with dimnames.
901 :     *
902 :     * @param x Pointer to an ssclme object
903 :     *
904 :     * @return a vector containing the conditional modes of the random effects
905 :     */
906 :     SEXP ssclme_ranef(SEXP x)
907 :     {
908 : bates 21 SEXP RZXsl = GET_SLOT(x, Matrix_RZXSym),
909 :     GpSl = GET_SLOT(x, Matrix_GpSym);
910 : bates 10 int *dims = INTEGER(getAttrib(RZXsl, R_DimSymbol)),
911 : bates 21 *Gp = INTEGER(GpSl),
912 :     *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
913 :     i, j,
914 : bates 10 n = dims[0],
915 : bates 21 nf = length(GpSl) - 1,
916 : bates 10 pp1 = dims[1],
917 :     p = pp1 - 1;
918 : bates 21 SEXP val = PROTECT(allocVector(VECSXP, nf));
919 : bates 10 double
920 : bates 21 *b = REAL(RZXsl) + n * p,
921 : bates 10 ryyinv; /* ryy-inverse */
922 :    
923 :     ssclme_invert(x);
924 :     ryyinv = REAL(GET_SLOT(x, Matrix_RXXSym))[pp1*pp1 - 1];
925 : bates 21 for (i = 0; i < nf; i++) {
926 : bates 34 int nci = nc[i], Mi = Gp[i+1] - Gp[i];
927 : bates 21 double *mm;
928 :    
929 : bates 34 SET_VECTOR_ELT(val, i, allocMatrix(REALSXP, nci, Mi/nci));
930 : bates 21 mm = Memcpy(REAL(VECTOR_ELT(val, i)), b, Mi);
931 : bates 34 b += Mi;
932 : bates 21 for (j = 0; j < Mi; j++) mm[j] /= ryyinv;
933 :     }
934 : bates 10 UNPROTECT(1);
935 :     return val;
936 :     }
937 : bates 34
938 : bates 10 /**
939 :     * Extract the ML or REML conditional estimate of sigma
940 :     *
941 :     * @param x pointer to an ssclme object
942 :     * @param REML logical scalar - TRUE if REML estimates are requested
943 :     *
944 :     * @return numeric scalar
945 :     */
946 :     SEXP ssclme_sigma(SEXP x, SEXP REML)
947 :     {
948 :     SEXP RXXsl = GET_SLOT(x, Matrix_RXXSym);
949 :     int pp1 = INTEGER(getAttrib(RXXsl, R_DimSymbol))[1],
950 :     nobs = INTEGER(GET_SLOT(x, Matrix_ncSym))
951 :     [length(GET_SLOT(x, Matrix_GpSym))];
952 :    
953 :     ssclme_invert(x);
954 :     return ScalarReal(1./(REAL(RXXsl)[pp1*pp1 - 1] *
955 :     sqrt((double)(asLogical(REML) ?
956 :     nobs + 1 - pp1 : nobs))));
957 :     }
958 :    
959 :     static
960 :     int coef_length(int nf, const int nc[])
961 :     {
962 :     int i, ans = 0;
963 :     for (i = 0; i < nf; i++) ans += (nc[i] * (nc[i] + 1))/2;
964 :     return ans;
965 :     }
966 :    
967 :     /**
968 :     * Extract the upper triangles of the Omega matrices.
969 :     * (These are not in any sense "coefficients" but the extractor is
970 :     * called coef for historical reasons.)
971 :     *
972 :     * @param x pointer to an ssclme object
973 :     *
974 :     * @return numeric vector of the values in the upper triangles of the
975 :     * Omega matrices
976 :     */
977 :     SEXP ssclme_coef(SEXP x)
978 :     {
979 :     SEXP Omega = GET_SLOT(x, Matrix_OmegaSym);
980 :     int *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
981 :     i, nf = length(Omega), vind;
982 :     SEXP val = PROTECT(allocVector(REALSXP, coef_length(nf, nc)));
983 :     double *vv = REAL(val);
984 :    
985 :     vind = 0;
986 :     for (i = 0; i < nf; i++) {
987 :     int j, k, nci = nc[i];
988 :     double *omgi = REAL(VECTOR_ELT(Omega, i));
989 :     for (j = 0; j < nci; j++) {
990 :     for (k = 0; k <= j; k++) {
991 :     vv[vind++] = omgi[j*nci + k];
992 :     }
993 :     }
994 :     }
995 :     UNPROTECT(1);
996 :     return val;
997 :     }
998 :    
999 :     /**
1000 : bates 19 * Extract the upper triangles of the Omega matrices in the unconstrained
1001 :     * parameterization.
1002 :     * (These are not in any sense "coefficients" but the extractor is
1003 :     * called coef for historical reasons.)
1004 :     *
1005 :     * @param x pointer to an ssclme object
1006 :     *
1007 :     * @return numeric vector of the values in the upper triangles of the
1008 :     * Omega matrices
1009 :     */
1010 :     SEXP ssclme_coefUnc(SEXP x)
1011 :     {
1012 :     SEXP Omega = GET_SLOT(x, Matrix_OmegaSym);
1013 :     int *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
1014 :     i, nf = length(Omega), vind;
1015 :     SEXP val = PROTECT(allocVector(REALSXP, coef_length(nf, nc)));
1016 :     double *vv = REAL(val);
1017 :    
1018 :     vind = 0;
1019 :     for (i = 0; i < nf; i++) {
1020 :     int nci = nc[i];
1021 :     if (nci == 1) {
1022 :     vv[vind++] = log(REAL(VECTOR_ELT(Omega, i))[0]);
1023 :     } else {
1024 :     int j, k, ncip1 = nci + 1, ncisq = nci * nci;
1025 :     double *tmp = Memcpy(Calloc(ncisq, double),
1026 :     REAL(VECTOR_ELT(Omega, i)), ncisq);
1027 :     F77_CALL(dpotrf)("U", &nci, tmp, &nci, &j);
1028 :     if (j) /* should never happen */
1029 :     error("DPOTRF returned error code %d", j);
1030 :     for (j = 0; j < nci; j++) {
1031 :     double diagj = tmp[j * ncip1];
1032 :     vv[vind++] = 2. * log(diagj);
1033 :     for (k = j + 1; k < nci; k++) {
1034 :     tmp[j + k * nci] /= diagj;
1035 :     }
1036 :     }
1037 :     for (j = 0; j < nci; j++) {
1038 :     for (k = j + 1; k < nci; k++) {
1039 :     vv[vind++] = tmp[j + k * nci];
1040 :     }
1041 :     }
1042 :     Free(tmp);
1043 :     }
1044 :     }
1045 :     UNPROTECT(1);
1046 :     return val;
1047 :     }
1048 :    
1049 :     /**
1050 :     * Assign the upper triangles of the Omega matrices in the unconstrained
1051 :     * parameterization.
1052 :     *
1053 :     * @param x pointer to an ssclme object
1054 :     * @param coef pointer to an numeric vector of appropriate length
1055 :     *
1056 :     * @return R_NilValue
1057 :     */
1058 :     SEXP ssclme_coefGetsUnc(SEXP x, SEXP coef)
1059 :     {
1060 :     SEXP Omega = GET_SLOT(x, Matrix_OmegaSym);
1061 :     int *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
1062 :     cind, i, nf = length(Omega),
1063 :     *status = LOGICAL(GET_SLOT(x, Matrix_statusSym));
1064 :     double *cc = REAL(coef);
1065 :    
1066 :     if (length(coef) != coef_length(nf, nc) || !isReal(coef))
1067 :     error("coef must be a numeric vector of length %d",
1068 :     coef_length(nf, nc));
1069 :     cind = 0;
1070 :     for (i = 0; i < nf; i++) {
1071 :     int nci = nc[i];
1072 :     if (nci == 1) {
1073 :     REAL(VECTOR_ELT(Omega, i))[0] = exp(cc[cind++]);
1074 :     } else {
1075 :     int odind = cind + nci, /* off-diagonal index */
1076 :     j, k,
1077 :     ncip1 = nci + 1,
1078 :     ncisq = nci * nci;
1079 :     double
1080 :     *omgi = REAL(VECTOR_ELT(Omega, i)),
1081 :     *tmp = Calloc(ncisq, double),
1082 :     diagj, one = 1.;
1083 : bates 28 /* FIXEME: Change this to use a factor and dsyrk */
1084 : bates 19 /* LD in omgi and L' in tmp */
1085 :     memset(omgi, 0, sizeof(double) * ncisq);
1086 :     for (j = 0; j < nci; j++) {
1087 :     omgi[j * ncip1] = diagj = exp(cc[cind++]);
1088 :     for (k = j + 1; k < nci; k++) {
1089 :     omgi[j*nci + k] = diagj * (tmp[k*nci + j] = cc[odind++]);
1090 :     }
1091 :     }
1092 :     F77_CALL(dtrmm)("R", "U", "N", "U", &nci, &nci, &one,
1093 :     tmp, &nci, omgi, &nci);
1094 :     Free(tmp);
1095 :     cind = odind;
1096 :     }
1097 :     }
1098 :     status[0] = status[1] = 0;
1099 :     return x;
1100 :     }
1101 :    
1102 :     /**
1103 : bates 10 * Assign the upper triangles of the Omega matrices.
1104 :     * (These are not in any sense "coefficients" but are
1105 :     * called coef for historical reasons.)
1106 :     *
1107 :     * @param x pointer to an ssclme object
1108 :     * @param coef pointer to an numeric vector of appropriate length
1109 :     *
1110 :     * @return R_NilValue
1111 :     */
1112 :     SEXP ssclme_coefGets(SEXP x, SEXP coef)
1113 :     {
1114 :     SEXP Omega = GET_SLOT(x, Matrix_OmegaSym);
1115 :     int *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
1116 :     cind, i, nf = length(Omega),
1117 :     *status = LOGICAL(GET_SLOT(x, Matrix_statusSym));
1118 :     double *cc = REAL(coef);
1119 :    
1120 :     if (length(coef) != coef_length(nf, nc) || !isReal(coef))
1121 :     error("coef must be a numeric vector of length %d",
1122 :     coef_length(nf, nc));
1123 :     cind = 0;
1124 :     for (i = 0; i < nf; i++) {
1125 :     int j, k, nci = nc[i];
1126 :     double *omgi = REAL(VECTOR_ELT(Omega, i));
1127 :     for (j = 0; j < nci; j++) {
1128 :     for (k = 0; k <= j; k++) {
1129 :     omgi[j*nci + k] = cc[cind++];
1130 :     }
1131 :     }
1132 :     }
1133 :     status[0] = status[1] = 0;
1134 : bates 11 return x;
1135 : bates 10 }
1136 :    
1137 : bates 11 SEXP ssclme_EMsteps(SEXP x, SEXP nsteps, SEXP REMLp, SEXP verb)
1138 : bates 10 {
1139 :     SEXP
1140 :     Omega = GET_SLOT(x, Matrix_OmegaSym),
1141 :     RZXsl = GET_SLOT(x, Matrix_RZXSym),
1142 :     ncsl = GET_SLOT(x, Matrix_ncSym),
1143 :     bVar = GET_SLOT(x, Matrix_bVarSym);
1144 :     int
1145 :     *Gp = INTEGER(GET_SLOT(x, Matrix_GpSym)),
1146 :     *dims = INTEGER(getAttrib(RZXsl, R_DimSymbol)),
1147 :     *nc = INTEGER(ncsl),
1148 :     *status = LOGICAL(GET_SLOT(x, Matrix_statusSym)),
1149 :     REML = asLogical(REMLp),
1150 :     i, info, iter,
1151 :     n = dims[0],
1152 :     nEM = asInteger(nsteps),
1153 :     nf = length(ncsl) - 2,
1154 :     nobs = nc[nf + 1],
1155 :     p,
1156 :     pp1 = dims[1],
1157 :     verbose = asLogical(verb);
1158 :     double
1159 :     *RZX = REAL(RZXsl),
1160 :     *dev = REAL(GET_SLOT(x, Matrix_devianceSym)),
1161 :     *b,
1162 :     alpha,
1163 :     one = 1.,
1164 :     zero = 0.;
1165 :    
1166 :     p = pp1 - 1;
1167 :     b = RZX + p * n;
1168 :     if (verbose) Rprintf(" EM iterations\n");
1169 :     for (iter = 0; iter <= nEM; iter++) {
1170 :     ssclme_invert(x);
1171 :     if (verbose) {
1172 :     SEXP coef = PROTECT(ssclme_coef(x));
1173 :     int lc = length(coef); double *cc = REAL(coef);
1174 :     Rprintf("%3d %.3f", iter, dev[REML ? 1 : 0]);
1175 :     for (i = 0; i < lc; i++) Rprintf(" %#8g", cc[i]);
1176 :     Rprintf("\n");
1177 :     UNPROTECT(1);
1178 :     }
1179 :     for (i = 0; i < nf; i++) {
1180 :     int ki = Gp[i+1] - Gp[i],
1181 :     nci = nc[i],
1182 :     mi = ki/nci;
1183 :     double
1184 :     *vali = REAL(VECTOR_ELT(Omega, i));
1185 :    
1186 :     alpha = ((double)(REML?(nobs-p):nobs))/((double)mi);
1187 :     F77_CALL(dsyrk)("U", "N", &nci, &mi,
1188 :     &alpha, b + Gp[i], &nci,
1189 :     &zero, vali, &nci);
1190 :     alpha = 1./((double) mi);
1191 :     F77_CALL(dsyrk)("U", "N", &nci, &ki,
1192 :     &alpha, REAL(VECTOR_ELT(bVar, i)), &nci,
1193 :     &one, vali, &nci);
1194 :     if (REML) {
1195 :     int mp = mi * p;
1196 :     F77_CALL(dsyrk)("U", "N", &nci, &mp,
1197 :     &alpha, RZX + Gp[i], &nci,
1198 :     &one, vali, &nci);
1199 :     }
1200 :     F77_CALL(dpotrf)("U", &nci, vali, &nci, &info);
1201 :     if (info) error("DPOTRF returned error code %d", info);
1202 :     F77_CALL(dpotri)("U", &nci, vali, &nci, &info);
1203 :     if (info) error("DPOTRF returned error code %d", info);
1204 :     }
1205 :     status[0] = status[1] = 0;
1206 :     }
1207 :     ssclme_factor(x);
1208 :     return R_NilValue;
1209 :     }
1210 : bates 11
1211 : bates 28 SEXP ssclme_fitted(SEXP x, SEXP facs, SEXP mmats)
1212 :     {
1213 :     SEXP val, b;
1214 :     int *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
1215 :     i, ione = 1, nf = length(facs), nobs, p;
1216 :     double *vv, one = 1.0, zero = 0.0;
1217 :    
1218 :     if (nf < 1)
1219 :     error("null factor list passed to ssclme_fitted");
1220 :     nobs = length(VECTOR_ELT(facs, 0));
1221 :     val = PROTECT(allocVector(REALSXP, nobs));
1222 :     vv = REAL(val);
1223 :     p = nc[nf] - 1;
1224 :     if (p > 0) {
1225 :     F77_CALL(dgemm)("N", "N", &nobs, &ione, &p, &one,
1226 :     REAL(VECTOR_ELT(mmats, nf)), &nobs,
1227 :     REAL(PROTECT(ssclme_fixef(x))), &p,
1228 :     &zero, vv, &nobs);
1229 :     UNPROTECT(1);
1230 :     } else {
1231 :     memset(vv, 0, sizeof(double) * nobs);
1232 :     }
1233 :     b = PROTECT(ssclme_ranef(x));
1234 :     for (i = 0; i < nf; i++) {
1235 :     int *ff = INTEGER(VECTOR_ELT(facs, i)), j, nci = nc[i];
1236 :     double *bb = REAL(VECTOR_ELT(b, i)),
1237 :     *mm = REAL(VECTOR_ELT(mmats, i));
1238 :     for (j = 0; j < nobs; ) {
1239 :     int nn = 1, lev = ff[j];
1240 :     /* check for adjacent rows with same factor level */
1241 :     while (ff[j + nn] == lev) nn++;
1242 :     F77_CALL(dgemm)("N", "N", &nn, &ione, &nci,
1243 :     &one, mm + j, &nobs,
1244 : bates 34 bb + (lev - 1) * nci, &nci,
1245 : bates 28 &one, vv + j, &nobs);
1246 :     j += nn;
1247 :     }
1248 :     }
1249 :     UNPROTECT(2);
1250 :     return val;
1251 :     }
1252 : bates 45
1253 :     SEXP ssclme_variances(SEXP x, SEXP REML)
1254 :     {
1255 : bates 57 SEXP Omg = PROTECT(duplicate(GET_SLOT(x, Matrix_OmegaSym))),
1256 :     val = PROTECT(allocVector(VECSXP, 2));
1257 : bates 45 int *nc = INTEGER(GET_SLOT(x, Matrix_ncSym)),
1258 : bates 57 i, nf = length(Omg);
1259 :     double sigmasq;
1260 : bates 45
1261 : bates 57
1262 :     SET_VECTOR_ELT(val, 0, Omg);
1263 :     SET_VECTOR_ELT(val, 1, ssclme_sigma(x, REML));
1264 :     sigmasq = REAL(VECTOR_ELT(val, 1))[0];
1265 :     sigmasq = (sigmasq) * (sigmasq);
1266 : bates 45 for (i = 0; i < nf; i++) {
1267 : bates 57 double *mm = REAL(VECTOR_ELT(Omg, i));
1268 : bates 45 int j, k, nci = nc[i], ncip1 = nci+1;
1269 :    
1270 :     F77_CALL(dpotrf)("U", &nci, mm, &nci, &j);
1271 :     if (j) /* shouldn't happen */
1272 :     error("DPOTRF returned error code %d on Omega[%d]",
1273 :     j, i + 1);
1274 :     F77_CALL(dpotri)("U", &nci, mm, &nci, &j);
1275 :     if (j) /* shouldn't happen */
1276 :     error("DTRTRI returned error code %d on Omega[%d]",
1277 :     j, i + 1);
1278 :     for (j = 0; j < nci; j++) {
1279 :     mm[j * ncip1] *= sigmasq;
1280 :     for (k = 0; k < j; k++) {
1281 :     mm[j + k * nci] = (mm[k + j * nci] *= sigmasq);
1282 :     }
1283 :     }
1284 :     }
1285 : bates 57 UNPROTECT(2);
1286 : bates 45 return val;
1287 :     }
1288 : bates 70
1289 :     SEXP ssclme_L_LI_sizes(SEXP facs)
1290 :     {
1291 :     SEXP ans = PROTECT(allocVector(INTSXP, 4)),
1292 :     ctab;
1293 :     int *Ai, *Ap, *Lp, *Parent, *aa = INTEGER(ans), *dims, *perm,
1294 :     nzcol;
1295 :     /* Pairwise cross-tabulation */
1296 :     ctab = PROTECT(sscCrosstab(facs, ScalarLogical(1)));
1297 :     Ai = INTEGER(GET_SLOT(ctab, Matrix_iSym));
1298 :     Ap = INTEGER(GET_SLOT(ctab, Matrix_pSym));
1299 :     dims = INTEGER(GET_SLOT(ctab, Matrix_DimSym));
1300 :     nzcol = dims[1];
1301 :     Lp = Calloc(nzcol + 1, int);
1302 :     Parent = Calloc(nzcol, int);
1303 :     ldl_symbolic(nzcol, Ap, Ai, Lp, Parent,
1304 :     (int *) R_alloc(nzcol, sizeof(int)), /* Lnz */
1305 :     (int *) R_alloc(nzcol, sizeof(int)), /* Flag */
1306 :     (int *) NULL, (int *) NULL); /* P & Pinv */
1307 :     aa[0] = Lp[nzcol];
1308 :     ssclme_fill_LIp(nzcol, Parent, Lp);
1309 :     aa[1] = Lp[nzcol];
1310 :     perm = Calloc(nzcol, int);
1311 :     ssc_metis_order(nzcol, Ap, Ai, perm, Parent);
1312 :     ssc_symbolic_permute(nzcol, 1, Parent, Ap, Ai);
1313 :     ldl_symbolic(nzcol, Ap, Ai, Lp, Parent,
1314 :     (int *) R_alloc(nzcol, sizeof(int)), /* Lnz */
1315 :     (int *) R_alloc(nzcol, sizeof(int)), /* Flag */
1316 :     (int *) NULL, (int *) NULL); /* P & Pinv */
1317 :     aa[2] = Lp[nzcol];
1318 :     ssclme_fill_LIp(nzcol, Parent, Lp);
1319 :     aa[3] = Lp[nzcol];
1320 :     Free(perm); Free(Parent); Free(Lp);
1321 :     UNPROTECT(2);
1322 :     return ans;
1323 :     }

root@r-forge.r-project.org
ViewVC Help
Powered by ViewVC 1.0.0  
Thanks to:
Vienna University of Economics and Business Powered By FusionForge