Utilizarea spread() pentru a converti datetime în nume de coloană (Programare, R, Dplyr, Tidyverse, Lubridate)

Jason a intrebat.

Am un set de date care are două coloane: prima se numește „key” și conține datetime (deși în prezent sub forma unui caracter), iar a doua conține mai multe valori datetime. Aș dori să folosesc spread pentru a face ca rândurile cheie să devină nume de coloane. Cam complicat, dar odată ce acest lucru este realizat, voi converti tibble-ul într-o listă și îl voi folosi cu o altă funcție pentru a crea programe care sunt numite după titlul coloanei datetime.

Datele arată astfel acum:

new_dat <- structure(list(key = c("2018-01-01 01:00:00", "2018-01-01 01:00:00", 
                       "2018-01-01 01:00:00", "2018-01-01 01:00:00", "2018-01-01 01:00:00", 
                       "2018-01-02 01:00:00", "2018-01-02 01:00:00", "2018-01-02 01:00:00", 
                       "2018-01-02 01:00:00", "2018-01-02 01:00:00", "2018-01-03 01:00:00", 
                       "2018-01-03 01:00:00", "2018-01-03 01:00:00", "2018-01-03 01:00:00", 
                       "2018-01-03 01:00:00"), value = structure(c(1514835600, 1514920800, 
                                                                   1515013380, 1515100860, 1515173100, 1514925060, 1514994060, 1515088920, 
                                                                   1515181020, 1515271740, 1515011880, 1515079200, 1515174240, 1515256980, 
                                                                   1515345600), class = c("POSIXct", "POSIXt"), tzone = "America/Boise")), class = c("tbl_df", 
                                                                                                                                                     "tbl", "data.frame"), row.names = c(NA, -15L), .Names = c("key", 
                                                                                                                                                                                                               "value"))

Și vreau să arate cam așa:

A tibble: 7,201 x 3
    `2018-01-01 01:00:00` `2018-01-02 01:00:00` `2018-01-03 01:00:00`
    <dttm>                <dttm>                <dttm>               
    2018-01-01 01:00:00   2018-01-02 01:00:00   2018-01-03 01:00:00

Am folosit spread() și am primit următoarea eroare:

Error in eval_tidy(enquo(var), var_env) : object '' not found

Este posibil să faceți din datatime un nume de coloană cu spread()?

1 răspunsuri
akrun

Avem nevoie de o coloană de secvență, deoarece există înregistrări duplicate

library(tidyverse)
new_dat %>%
  group_by(key) %>% 
  mutate(rn = row_number()) %>% 
  spread(key, value) %>%
  select(-rn)
# A tibble: 5 x 3
#  `2018-01-01 01:00:00` `2018-01-02 01:00:00` `2018-01-03 01:00:00`
#  <dttm>                <dttm>                <dttm>               
#1 2018-01-01 12:40:00   2018-01-02 13:31:00   2018-01-03 13:38:00  
#2 2018-01-02 12:20:00   2018-01-03 08:41:00   2018-01-04 08:20:00  
#3 2018-01-03 14:03:00   2018-01-04 11:02:00   2018-01-05 10:44:00  
#4 2018-01-04 14:21:00   2018-01-05 12:37:00   2018-01-06 09:43:00  
#5 2018-01-05 10:25:00   2018-01-06 13:49:00   2018-01-07 10:20:00