-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathxp_16_septembre.R
90 lines (62 loc) · 2.54 KB
/
xp_16_septembre.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
##.###################################################################################33
## I. Chargement des données de l'xp ====
##.#################################################################################33
## 1 - les données ================
# ici les données nous sont arrivées par bout et pas toujours sous la même forme ce qui explique le
# chargement de plusieurs scripts qui les prépare
# xp du 26/09/2019
source("chargement_xp.R")
summary(xp_bota.shp)
dim(xp_bota.shp)
# xp du 16/09/2019
source("chargement_xp_16_09.R")
#### verif rapide
summary(xp_16_09_bota.shp)
dim(xp_16_09_bota.shp)
# xp du 01/10/2019
source("chargement_xp_01_10.R")
summary(xp_01_10_bota.shp)
dim(xp_01_10_bota.shp)
##.###################################################################################33
## II. une seule db ====
##.#################################################################################33
## 1 - On fusione ================
# on vérifie nom et ordres des colonnes
names(xp_bota.shp) == names(xp_16_09_bota.shp)
names(xp_bota.shp) == names(xp_01_10_bota.shp)
# on fusionne le tout
# ici je suis resté en Rbase pe nfaire en dplyr pour ne pas perdre la géométrie
xp.dat <- rbind(as.data.frame(xp_16_09_bota.shp), as.data.frame(xp_bota.shp), as.data.frame(xp_01_10_bota.shp))
# on en refait un objet sf
xp.shp <- st_as_sf(xp.dat, sf_column_name = "geometry")
## 2 - On corrige/armonise les données ================
# on vérifie
summary(xp.shp)
dim(xp.shp)
# on repasse en factor / num pour les participants
xp.shp <- transform(xp.shp,Participant = as.factor(as.numeric(factor(username))))
# correction d'étrangeté : un oubli de bon !
# je l'ai directement corrigé dans le json maintenant il y a des "vides" qui devrait
# févier d''amerique à verifier
unique(xp.shp$confiance)
# on passe en facteur pour confiance
xp.shp$confiance <- factor(xp.shp$confiance)
#ajout en facteur
xp.shp$ajout[is.na(xp.shp$ajout)] <- 0
xp.shp$ajout <- factor(xp.shp$ajout)
#verif
summary(xp.shp)
saveRDS(xp.shp, "data/xp_total.rds")
##.###################################################################################33
## III. Première stats ====
##.#################################################################################33
summary(xp_16_09_bota.shp)
dim(xp_16_09_bota.shp)
length(unique(xp_16_09_bota.shp$username))
# pe faire une fonction annonyme
compteNA <- function(x) {sum(is.na(x))}
# comptage des na par colonne
sapply(xp_16_09_bota.shp, compteNA)
table(newObservation$username)
table(xp_16_09_bota.shp$username)
names(xp_bota.shp )