SCM

SCM Repository

[tm] Diff of /pkg/R/corpus.R
ViewVC logotype

Diff of /pkg/R/corpus.R

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1363, Mon Apr 28 09:49:46 2014 UTC revision 1377, Wed May 21 17:15:56 2014 UTC
# Line 24  Line 24 
24      while (!eoi(x)) {      while (!eoi(x)) {
25          x <- stepNext(x)          x <- stepNext(x)
26          elem <- getElem(x)          elem <- getElem(x)
27          id <- if (is.null(names(x)))          doc <- readerControl$reader(elem,
28              as.character(counter)                                      readerControl$language,
29          else                                      as.character(counter))
             names(x)[counter]  
         doc <- readerControl$reader(elem, readerControl$language, id)  
30          filehash::dbInsert(db, meta(doc, "id"), doc)          filehash::dbInsert(db, meta(doc, "id"), doc)
31          tdl[[counter]] <- meta(doc, "id")          tdl[[counter]] <- meta(doc, "id")
32          counter <- counter + 1          counter <- counter + 1
33      }      }
     if (!is.null(names(x)))  
         names(tdl) <- names(x)  
34    
35      structure(list(content = tdl,      structure(list(content = tdl,
36                     meta = CorpusMeta(),                     meta = CorpusMeta(),
# Line 63  Line 59 
59          tdl <- mapply(function(elem, id)          tdl <- mapply(function(elem, id)
60                            readerControl$reader(elem, readerControl$language, id),                            readerControl$reader(elem, readerControl$language, id),
61                        pGetElem(x),                        pGetElem(x),
62                        id = if (is.null(names(x)))                        id = as.character(seq_along(x)),
                           as.character(seq_len(length(x)))  
                       else names(x),  
63                        SIMPLIFY = FALSE)                        SIMPLIFY = FALSE)
64      else {      else {
65          counter <- 1          counter <- 1
66          while (!eoi(x)) {          while (!eoi(x)) {
67              x <- stepNext(x)              x <- stepNext(x)
68              elem <- getElem(x)              elem <- getElem(x)
69              id <- if (is.null(names(x)))              doc <- readerControl$reader(elem,
70                  as.character(counter)                                          readerControl$language,
71              else                                          as.character(counter))
                 names(x)[counter]  
             doc <- readerControl$reader(elem, readerControl$language, id)  
72              tdl[[counter]] <- doc              tdl[[counter]] <- doc
73              counter <- counter + 1              counter <- counter + 1
74          }          }
75      }      }
     if (!is.null(names(x)))  
         names(tdl) <- names(x)  
76    
77      structure(list(content = tdl,      structure(list(content = tdl,
78                     meta = CorpusMeta(),                     meta = CorpusMeta(),
# Line 115  Line 105 
105  .map_name_index <-  .map_name_index <-
106  function(x, i)  function(x, i)
107  {  {
108      if (is.character(i)) {      if (is.character(i))
109          n <- names(x$content)          match(i, meta(x, "id", "local"))
110          match(i, if (is.null(n)) meta(x, "id", "local") else n)      else
     } else  
111          i          i
112  }  }
113    
# Line 192  Line 181 
181          stop("not all arguments are of the same corpus type")          stop("not all arguments are of the same corpus type")
182    
183      structure(list(content = do.call("c", lapply(args, content)),      structure(list(content = do.call("c", lapply(args, content)),
184                     meta = structure(do.call("c",                     meta = CorpusMeta(meta = do.call("c",
185                       lapply(args, function(a) meta(a, type = "corpus"))),                       lapply(args, function(a) meta(a, type = "corpus")))),
                                     class = "CorpusMeta"),  
186                     dmeta = Reduce(outer_union, lapply(args, meta))),                     dmeta = Reduce(outer_union, lapply(args, meta))),
187                class = c("VCorpus", "Corpus"))                class = c("VCorpus", "Corpus"))
188  }  }
# Line 214  Line 202 
202      filehash::dbMultiFetch(db, unlist(x$content))      filehash::dbMultiFetch(db, unlist(x$content))
203  }  }
204    
205    inspect <-
206    function(x)
207        UseMethod("inspect", x)
208    inspect.PCorpus <- inspect.VCorpus <-
209    function(x)
210    {
211        print(x)
212        cat("\n")
213        print(noquote(content(x)))
214        invisible(x)
215    }
216    
217  length.PCorpus <- length.VCorpus <-  length.PCorpus <- length.VCorpus <-
218  function(x)  function(x)
219      length(x$content)      length(x$content)
220    
221    names.PCorpus <- names.VCorpus <-
222    function(x)
223        as.character(meta(x, "id", "local"))
224    
225  print.PCorpus <- print.VCorpus <-  print.PCorpus <- print.VCorpus <-
226  function(x, ...)  function(x, ...)
227  {  {
# Line 229  Line 233 
233      invisible(x)      invisible(x)
234  }  }
235    
 inspect <-  
 function(x)  
     UseMethod("inspect", x)  
 inspect.PCorpus <- inspect.VCorpus <-  
 function(x)  
 {  
     print(x)  
     cat("\n")  
     print(noquote(content(x)))  
     invisible(x)  
 }  
   
236  writeCorpus <-  writeCorpus <-
237  function(x, path = ".", filenames = NULL)  function(x, path = ".", filenames = NULL)
238  {  {

Legend:
Removed from v.1363  
changed lines
  Added in v.1377

root@r-forge.r-project.org
ViewVC Help
Powered by ViewVC 1.0.0  
Thanks to:
Vienna University of Economics and Business Powered By FusionForge