-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathchap5_exemple_code.R
More file actions
77 lines (62 loc) · 3.83 KB
/
chap5_exemple_code.R
File metadata and controls
77 lines (62 loc) · 3.83 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
library(RJDBC)
library(DBI)
library(dplyr)
library(ggplot2)
library(ggthemes)
options( java.parameters = c("-Xss2560k", "-Xmx7g") ) # Needed fix for rJava (JDBC) + ggplot2
drv <- JDBC("com.mapd.jdbc.MapDDriver",
"/data/user/c/rcura/mapd-1.0-SNAPSHOT-jar-with-dependencies.jar",
identifier.quote="'")
conMapD <- dbConnect(drv, "jdbc:mapd:mapdi.cura.info:9091:mapd", "mapd", "HyperInteractive")
NombreAgregatParAnnee <- tbl(conMapD, "agregats") %>% # Connexion à la table agregats de la BDD
filter(sim_name == "5_0") %>% # Filtre de la table en ne conservant que les experiences "5_0"
group_by(sim_name, seed, annee) %>% # Agrégation sur les identifiants de simulation (seed et sim_name) et par annee
summarise(NbAgregats = n()) %>% # Calcul du nombre total de lignes pour chaque agrégation
arrange(sim_name, seed, annee) %>% # Tri de la table selon les trois variables
collect() %>% # Récupération du résultat de la requête en mémoire
mutate(annee = factor(annee)) # Conversion du champ "annee" de numérique à facteur
NombreAgregatParAnnee %>% head(5)
# # A tibble: 5 x 4
# # Groups: sim_name, seed [4]
# sim_name seed annee NbAgregats
# <chr> <chr> <fct> <dbl>
# 1 5_0 0.0121401919575407 820 25.
# 2 5_0 0.0121401919575407 840 27.
# 3 5_0 0.0121401919575407 860 34.
# 4 5_0 0.0121401919575407 880 41.
# 5 5_0 0.0121401919575407 900 62.
NombreAgregatParAnnee %>% tail(5)
# # A tibble: 5 x 4
# # Groups: sim_name, seed [1]
# sim_name seed annee NbAgregats
# <chr> <chr> <fct> <dbl>
# 1 5_0 0.909195338056078 1080 104.
# 2 5_0 0.909195338056078 1100 98.
# 3 5_0 0.909195338056078 1120 106.
# 4 5_0 0.909195338056078 1140 118.
# 5 5_0 0.909195338056078 1160 113.
tbl(conMapD, "agregats") %>% # Connexion à la table agregats de la BDD
filter(sim_name == "5_0") %>% # Filtre de la table en ne conservant que les simulations de la version "5_0"
group_by(sim_name, seed, annee) %>% # Agrégation sur les identifiants de simulation (seed et sim_name) et par annee
summarise(NbAgregats = n()) %>% # Calcul du nombre total de lignes pour chaque agrégation
arrange(sim_name, seed, annee) %>% # Tri de la table selon les trois variables
show_query()
# SELECT "sim_name", "seed", "annee", COUNT() AS "NbAgregats"
# FROM "agregats"
# WHERE ("sim_name" = '5_0')
# GROUP BY "sim_name", "seed", "annee"
# ORDER BY "sim_name", "seed", "annee"
p1 <- ggplot(NombreAgregatParAnnee) + # Création d'un graphique avec le jeu de données NombreAgregatParAnnee
aes(x = annee, y = NbAgregats) + # "Mapping" des valeurs : champ "annee" en x, champ "NbAgregats" en y
geom_tufteboxplot() # Ajout d'une couche graphique de type boxplot minimaliste (Tufte boxplot)
ggsave(p1, filename = "chap5_exemple_indicateur.pdf", width = 20, height = 10, units = "cm")
tbl(conMapD, "agregats") %>% # Connexion à la table agregats de la BDD
filter(sim_name == "5_0") %>% # Filtre de la table en ne conservant que les experiences "5_0"
group_by(sim_name, seed, annee) %>% # Agrégation sur les identifiants de simulation (seed et sim_name) et par annee
summarise(NbAgregats = n()) %>% # Calcul du nombre total de lignes pour chaque agrégation
arrange(sim_name, seed, annee) %>% # Tri de la table selon les trois variables
collect() %>% # Récupération du résultat de la requête en mémoire
mutate(annee = factor(annee)) %>% # Conversion du champ "annee" de numérique à facteur
ggplot() + # Création d'un graphique avec le jeu de données créé jusque-là
aes(x = annee, y = NbAgregats) + # "Mapping" des valeurs : champ "annee" en x, champ "NbAgregats" en y
geom_tufteboxplot() # Ajout d'une couche graphique de type boxplot minimaliste (Tufte boxplot)