-
Notifications
You must be signed in to change notification settings - Fork 1
Expand file tree
/
Copy pathRDM_OrganizeData_fr.html
More file actions
1789 lines (1704 loc) · 95.4 KB
/
RDM_OrganizeData_fr.html
File metadata and controls
1789 lines (1704 loc) · 95.4 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
<!DOCTYPE html>
<html lang="en"><head>
<script src="RDM_OrganizeData_fr_files/libs/clipboard/clipboard.min.js"></script>
<script src="RDM_OrganizeData_fr_files/libs/quarto-html/tabby.min.js"></script>
<script src="RDM_OrganizeData_fr_files/libs/quarto-html/popper.min.js"></script>
<script src="RDM_OrganizeData_fr_files/libs/quarto-html/tippy.umd.min.js"></script>
<link href="RDM_OrganizeData_fr_files/libs/quarto-html/tippy.css" rel="stylesheet">
<link href="RDM_OrganizeData_fr_files/libs/quarto-html/light-border.css" rel="stylesheet">
<link href="RDM_OrganizeData_fr_files/libs/quarto-html/quarto-syntax-highlighting-e26003cea8cd680ca0c55a263523d882.css" rel="stylesheet" id="quarto-text-highlighting-styles">
<link href="RDM_OrganizeData_fr_files/libs/quarto-contrib/reveal-auto-agenda-0.0.3/reveal-auto-agenda.css" rel="stylesheet">
<link href="RDM_OrganizeData_fr_files/libs/quarto-contrib/bootstrap-icons-1.11.1/all.css" rel="stylesheet"><meta charset="utf-8">
<meta name="generator" content="quarto-1.6.39">
<meta name="author" content="Équipe de curation des données du DFDR">
<title>Traitement et organisation des données de recherche</title>
<meta name="apple-mobile-web-app-capable" content="yes">
<meta name="apple-mobile-web-app-status-bar-style" content="black-translucent">
<meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no, minimal-ui">
<link rel="stylesheet" href="RDM_OrganizeData_fr_files/libs/revealjs/dist/reset.css">
<link rel="stylesheet" href="RDM_OrganizeData_fr_files/libs/revealjs/dist/reveal.css">
<style>
code{white-space: pre-wrap;}
span.smallcaps{font-variant: small-caps;}
div.columns{display: flex; gap: min(4vw, 1.5em);}
div.column{flex: auto; overflow-x: auto;}
div.hanging-indent{margin-left: 1.5em; text-indent: -1.5em;}
ul.task-list{list-style: none;}
ul.task-list li input[type="checkbox"] {
width: 0.8em;
margin: 0 0.8em 0.2em -1em; /* quarto-specific, see https://github.com/quarto-dev/quarto-cli/issues/4556 */
vertical-align: middle;
}
</style>
<link rel="stylesheet" href="RDM_OrganizeData_fr_files/libs/revealjs/dist/theme/quarto-bbe7401fe57d4b791b917637bb662036.css">
<link rel="stylesheet" href="styles.css">
<link href="RDM_OrganizeData_fr_files/libs/revealjs/plugin/quarto-line-highlight/line-highlight.css" rel="stylesheet">
<link href="RDM_OrganizeData_fr_files/libs/revealjs/plugin/reveal-menu/menu.css" rel="stylesheet">
<link href="RDM_OrganizeData_fr_files/libs/revealjs/plugin/reveal-menu/quarto-menu.css" rel="stylesheet">
<link href="RDM_OrganizeData_fr_files/libs/revealjs/plugin/quarto-support/footer.css" rel="stylesheet">
<style type="text/css">
.reveal div.sourceCode {
margin: 0;
overflow: auto;
}
.reveal div.hanging-indent {
margin-left: 1em;
text-indent: -1em;
}
.reveal .slide:not(.center) {
height: 100%;
}
.reveal .slide.scrollable {
overflow-y: auto;
}
.reveal .footnotes {
height: 100%;
overflow-y: auto;
}
.reveal .slide .absolute {
position: absolute;
display: block;
}
.reveal .footnotes ol {
counter-reset: ol;
list-style-type: none;
margin-left: 0;
}
.reveal .footnotes ol li:before {
counter-increment: ol;
content: counter(ol) ". ";
}
.reveal .footnotes ol li > p:first-child {
display: inline-block;
}
.reveal .slide ul,
.reveal .slide ol {
margin-bottom: 0.5em;
}
.reveal .slide ul li,
.reveal .slide ol li {
margin-top: 0.4em;
margin-bottom: 0.2em;
}
.reveal .slide ul[role="tablist"] li {
margin-bottom: 0;
}
.reveal .slide ul li > *:first-child,
.reveal .slide ol li > *:first-child {
margin-block-start: 0;
}
.reveal .slide ul li > *:last-child,
.reveal .slide ol li > *:last-child {
margin-block-end: 0;
}
.reveal .slide .columns:nth-child(3) {
margin-block-start: 0.8em;
}
.reveal blockquote {
box-shadow: none;
}
.reveal .tippy-content>* {
margin-top: 0.2em;
margin-bottom: 0.7em;
}
.reveal .tippy-content>*:last-child {
margin-bottom: 0.2em;
}
.reveal .slide > img.stretch.quarto-figure-center,
.reveal .slide > img.r-stretch.quarto-figure-center {
display: block;
margin-left: auto;
margin-right: auto;
}
.reveal .slide > img.stretch.quarto-figure-left,
.reveal .slide > img.r-stretch.quarto-figure-left {
display: block;
margin-left: 0;
margin-right: auto;
}
.reveal .slide > img.stretch.quarto-figure-right,
.reveal .slide > img.r-stretch.quarto-figure-right {
display: block;
margin-left: auto;
margin-right: 0;
}
</style>
</head>
<body class="quarto-light">
<div class="reveal">
<div class="slides">
<section id="title-slide" class="quarto-title-block center">
<h1 class="title">Traitement et organisation des données de recherche</h1>
<p class="subtitle">un guide à l’usage des chercheurs</p>
<div class="quarto-title-authors">
<div class="quarto-title-author">
<div class="quarto-title-author-name">
Équipe de curation des données du DFDR
</div>
<div class="quarto-title-author-email">
<a href="mailto:curators@frdr-dfdr.ca">curators@frdr-dfdr.ca</a>
</div>
<p class="quarto-title-affiliation">
Alliance de recherche numérique du Canada
</p>
</div>
</div>
</section>
<section>
<section id="principes-pour-la-gestion-des-données-de-recherche" class="title-slide slide level1 agenda-slide center">
<h1>Principes pour la gestion des données de recherche</h1>
<div class="agenda-heading">
<p>Agenda</p>
</div>
<div class="agenda">
<ol>
<li><div class="agenda-active">
<p>Principes pour la gestion des données de recherche</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Gestion des tableaux de données</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Gestion des images</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Organiser (et partager) les données</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Rédiger un fichier README</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Liste de contrôle pour une recherche reproductible</p>
</div></li>
</ol>
</div>
</section>
<section id="rendre-les-ensembles-de-données-compréhensibles" class="slide level2 center">
<h2>Rendre les ensembles de données compréhensibles</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: left;font-size: 70%">
<p>Les données de recherche existent sous de nombreuses formats (<span style="color:orange;">tableaux</span>, <span style="color:magenta;">images</span>, <span style="color:red;">vidéos</span>, <span style="color:gray;">texte</span>).</p>
<p>Dans tous les cas, il est essentiel que l’ensemble de données ait une <span style="color:green;">structure</span> claire et soit <span style="color:green;">compréhensible</span> par d’autres.</p>
</div>
<div class="callout callout-tip callout-titled callout-style-default">
<div class="callout-body">
<div class="callout-title">
<div class="callout-icon-container">
<i class="callout-icon"></i>
</div>
<p><strong>Tip</strong></p>
</div>
<div class="callout-content">
<p>Essayez de vous mettre à la place d’un <span style="color:green;">observateur externe</span> lorsque vous structurez les données.</p>
</div>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center; font-size: 70%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/DificultData.webp" alt="Une illustration en noir et blanc représentant une personne frustrée, tenant sa tête et entourée de points d'interrogation. La personne est assise à une table couverte de grandes feuilles de calcul désorganisées, remplies de chiffres et de texte, symbolisant la difficulté à gérer et comprendre les données de recherche." width="400" height="400"></p>
<figcaption>Les autres ne comprennent généralement pas les données de recherche</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="utilisez-conventions-de-nommage" class="slide level2 center">
<h2>1. Utilisez conventions de nommage</h2>
<p>Utilisez des <a href="https://datamanagement.hms.harvard.edu/plan-design/file-naming-conventions">conventions de nommage</a> cohérentes qui décrivent fidèlement le contenu des fichiers et permettent l’interrelation entre eux :</p>
<div style="text-align: left;font-size: 80%">
<ul>
<li><i class="bi-card-image " style="" role="img" aria-hidden="true"></i> <span style="color:red;">A1.tif</span> <i class="bi-arrow-right " style="" role="img" aria-hidden="true"></i> <span style="color:green;">Exp_Souris_Jour_Condition_Marqueur.tif</span></li>
<li><i class="bi-file-earmark-spreadsheet " style="" role="img" aria-hidden="true"></i> <span style="color:red;">CellsTable.xls</span> <i class="bi-arrow-right " style="" role="img" aria-hidden="true"></i> <span style="color:green;">Widefield_5x_Cortex_NeuN_Comptes.csv</span></li>
</ul>
</div>
</section>
<section id="prioriser-formats-de-fichiers-ouverts" class="slide level2 center">
<h2>2. Prioriser formats de fichiers ouverts</h2>
<p>Utilisez des formats de <a href="https://osf.io/ena5p">fichiers appropriés et ouverts</a> pour améliorer l’accessibilité :</p>
<ul>
<li><i class="bi-card-image " style="" role="img" aria-hidden="true"></i> <span style="color:green;">.tif</span> pour les images (préserve les métadonnées).</li>
<li><i class="bi-file-earmark-spreadsheet " style="" role="img" aria-hidden="true"></i> <span style="color:green;">.csv</span> pour les tableaux (format non propriétaire).</li>
<li><i class="bi-file-bar-graph-fill " style="" role="img" aria-hidden="true"></i> <span style="color:green;">.png ou .svg</span> pour les graphiques (préserve la qualité).</li>
<li><i class="bi-file-earmark-pdf-fill " style="" role="img" aria-hidden="true"></i> <span style="color:green;">.txt ou .pdf</span> pour la documentation (format non propriétaire).</li>
</ul>
</section>
<section id="fournir-des-métadonnées-complètes" class="slide level2 center">
<h2>3. Fournir des métadonnées complètes</h2>
<p>Utilisez des <span style="color:green;">métadonnées détaillées</span> (fichiers README et dictionnaires de données/codebook) pour <span style="text-decoration: underline;">contextualiser</span> et <span style="text-decoration: underline;">décrire</span> les fichiers de recherche.</p>
<div style="text-align: center; font-size: 70%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/Codebook.jpg" alt="Un tableau présentant un codebook pour un ensemble de données, avec des colonnes intitulées 'Nom de variable,' 'Description,' 'Type,' et 'Valeurs ou caractéristiques.' Le tableau définit des variables telles que l'identifiant du patient, le sexe, la date de la procédure, le groupe de traitement et les résultats cliniques, en précisant les types de données (numérique, date, caractère) et les significations des valeurs (ex. 1=Femme, 2=Homme). Ce codebook fournit une vue d'ensemble structurée des variables utilisées dans la gestion des données de recherche." width="400" height="250"></p>
<figcaption>Exemple de codebook (https://domstat.med.ucla.edu/)</figcaption>
</figure>
</div>
</div>
</section>
<section id="mettre-en-œuvre-des-flux-de-travail-reproductibles" class="slide level2 center">
<h2>4. Mettre en œuvre des flux de travail reproductibles</h2>
<p>Mettez en place des <span style="color:green;">flux de travail reproductibles</span> en utilisant le codage (R, Python) pour transformer les <span style="text-decoration: underline;">données brutes</span> en données destinées à l’<span style="text-decoration: underline;">analyse</span>.</p>
<div class="callout callout-tip callout-titled callout-style-default">
<div class="callout-body">
<div class="callout-title">
<div class="callout-icon-container">
<i class="callout-icon"></i>
</div>
<p><strong>Tip</strong></p>
</div>
<div class="callout-content">
<p>Ces pratiques garantissent des ensembles de données <span style="color:green;">organisés, propres et validés</span>.</p>
</div>
</div>
</div>
</section></section>
<section>
<section id="gestion-des-tableaux-de-données" class="title-slide slide level1 agenda-slide center">
<h1>Gestion des tableaux de données</h1>
<div class="agenda-heading">
<p>Agenda</p>
</div>
<div class="agenda">
<ol>
<li><div class="agenda-inactive agenda-pre-active">
<p>Principes pour la gestion des données de recherche</p>
</div></li>
<li><div class="agenda-active">
<p>Gestion des tableaux de données</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Gestion des images</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Organiser (et partager) les données</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Rédiger un fichier README</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Liste de contrôle pour une recherche reproductible</p>
</div></li>
</ol>
</div>
</section>
<section id="les-tableaux-sont-au-cœur-des-données-de-recherche" class="slide level2 center">
<h2><i class="bi-file-earmark-spreadsheet " style="" role="img" aria-hidden="true"></i> Les tableaux sont au cœur des données de recherche</h2>
<div style="text-align: left;font-size: 70%">
<p>Bien qu’ils soient le type de fichier le plus courant (.xls) pour l’enregistrement et le stockage des données, les tableaux sont les objets les plus <span style="color:red;">mal organisés et inutilisables</span> en recherche.</p>
</div>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/BadTable1.webp" alt="Exemple de mauvais formatage de données, illustrant une feuille de calcul avec des cellules combinées et des variables différentes dans la même colonne." width="600" height="300"></p>
<figcaption>Source : https://dansteer.wordpress.com/</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/BadTable2.png" alt="Exemple de mauvais formatage des données, présentant une feuille de calcul avec des cellules combinées et des variables différentes dans la même colonne. On peut également observer une combinaison de chiffres et de données numériques dans la même feuille." width="600" height="300"></p>
<figcaption>Avec l’aimable autorisation d’un chercheur</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="exemples-issus-de-recherches-publiées" class="slide level2 center">
<h2>Exemples issus de recherches publiées</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/BadTable2_Zhao(2024)_NatureComm.png" alt="Exemple de mauvais formatage de données, présentant une feuille de calcul avec des cellules combinées et des variables différentes dans la même colonne. On peut également observer une combinaison de chiffres et de données numériques dans la même feuille." width="400" height="400"></p>
<figcaption>Zhao et al. (2024). Nature Comm. DOI: 10.1038/s41467-024-50836-6</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/BadTable2_Balinda(2024)_NatureComm.png" alt="Exemple de mauvais formatage de données, présentant une feuille de calcul avec des cellules combinées et des variables différentes dans la même colonne. Nous voyons également des codes de couleur qui ne doivent pas être définis dans une feuille de calcul de données." width="400" height="400"></p>
<figcaption>Balinda et al. (2024). Nature Comm. DOI: doi.org/10.1038/s41467-024-50558-9</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="exemples-de-crystal-lewis-2024" class="slide level2">
<h2>Exemples de <a href="https://datamgmtinedresearch.com/" class="center">Crystal Lewis (2024)</a></h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/Lewis_fig3-3.PNG" alt="Deux tableaux comparant des structures de données. Le tableau de gauche, intitulé 'Pas un rectangle,' présente une structure irrégulière avec un alignement incohérent des noms de variables et des valeurs, rendant son interprétation difficile. Le tableau de droite, intitulé 'Rectangle,' suit un format structuré avec des colonnes clairement définies pour l'ID étudiant, l'âge en mois, le score brut de lecture et le score standardisé de lecture. Cette comparaison met en évidence l'importance d'un format de données bien organisé pour la gestion des données de recherche."></p>
<figcaption>Lewis (2024). DOI: 10.1201/9781032622835-3</figcaption>
</figure>
</div>
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/Lewis_fig3-4.PNG" alt="Deux tableaux comparant la cohérence des valeurs de colonnes. Le tableau de gauche, intitulé 'Valeurs de colonnes incohérentes,' contient des formats de date variés (ex. '10-12-2023,' 'Oct. 15, 2023,' 'September 15') et des valeurs catégoriques incohérentes pour l'achèvement du sondage ('y,' 'Yes,' 'Y,' 'no'). Le tableau de droite, intitulé 'Valeurs de colonnes cohérentes,' normalise les dates au format 'AAAA-MM-JJ' et unifie les réponses catégoriques en 'y' et 'n.' Cette comparaison illustre les meilleures pratiques pour garantir la clarté et la fiabilité des données."></p>
<figcaption>Lewis (2024). DOI: 10.1201/9781032622835-3</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/Lewis_fig3-5.PNG" alt="Deux tableaux comparant les formats de variables. Le tableau de gauche, intitulé 'Variable de type caractère,' contient des valeurs d'âge incohérentes : un espace avant '24' fait de cette entrée un texte, '49 years old' ajoute du texte inutile, et '36..0' contient une erreur de formatage. Le tableau de droite, intitulé 'Variable numérique,' stocke correctement les âges sous forme numérique sans espace, texte superflu ou erreurs de formatage. Cette comparaison met en évidence l'importance du nettoyage des données numériques pour une analyse correcte."></p>
<figcaption>Lewis (2024). DOI: 10.1201/9781032622835-3</figcaption>
</figure>
</div>
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/Lewis_fig3-6.PNG" alt="Deux tableaux comparant la structuration des données. Le tableau de gauche, intitulé 'Deux informations dans une seule variable,' combine le nombre d'incidents et le nombre total d'inscrits en une seule colonne (ex. '55/250'), rendant l'analyse plus difficile. Le tableau de droite, intitulé 'Deux informations dans deux variables,' sépare ces valeurs en colonnes distinctes : 'incident' pour le nombre d'incidents et 'enrollment' pour le nombre d'inscrits. Cette structuration facilite l'analyse et suit les bonnes pratiques de gestion des données."></p>
<figcaption>Lewis (2024). DOI: 10.1201/9781032622835-3</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="exemples-de-crystal-lewis-2024-1" class="slide level2">
<h2>Exemples de <a href="https://datamgmtinedresearch.com/" class="center">Crystal Lewis (2024)</a></h2>
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/Lewis_fig3-7.PNG" alt="Deux tableaux comparant l'utilisation de valeurs explicites et implicites. Le tableau de gauche, intitulé 'Valeurs non explicites,' omet la répétition des identifiants d'école et des années, supposant qu'ils s'appliquent à plusieurs lignes, ce qui peut causer des erreurs lors du traitement des données. Le tableau de droite, intitulé 'Valeurs explicites,' répète ces informations pour chaque ligne, garantissant une clarté accrue et une meilleure lisibilité pour l'analyse." width="500" height="200"></p>
<figcaption>Lewis (2024). DOI: 10.1201/9781032622835-3</figcaption>
</figure>
</div>
</div>
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/Lewis_fig3-8.PNG" alt="Deux tableaux comparant l'utilisation explicite et implicite des variables. Le tableau de gauche, intitulé 'Variables non explicites,' utilise la couleur des cellules pour indiquer les conditions de traitement, ce qui peut être mal interprété ou perdu dans l'analyse. Le tableau de droite, intitulé 'Variables explicites,' ajoute une colonne 'treatment' avec des valeurs numériques (0 ou 1) pour indiquer explicitement la condition de traitement. Cette approche garantit une meilleure transparence des données et facilite leur analyse." width="600" height="200"></p>
<figcaption>Lewis (2024). DOI: 10.1201/9781032622835-3</figcaption>
</figure>
</div>
</div>
</section>
<section id="construire-des-tableaux-de-données-accessibles" class="slide level2 center">
<h2><i class="bi-file-earmark-spreadsheet " style="" role="img" aria-hidden="true"></i> Construire des tableaux de données accessibles</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 60%">
<div class="quarto-figure quarto-figure-left">
<figure>
<p><img data-src="images/GoodTable.png" alt="Un tableau bien structuré affichant des données expérimentales pour différentes souris. Les colonnes incluent 'MouseID,' 'DPI' (jours après la lésion), 'Condition' (MCAO), 'Région' (Contra, Ipsi, Peri), ainsi que les comptages cellulaires pour NeuN, Ki67 et BrdU. La colonne 'MouseID' est surlignée en orange pour la distinguer visuellement. Ce tableau illustre une organisation claire des données, essentielle pour leur analyse en recherche." width="500" height="300"></p>
<figcaption>Un tableau de données typique au format long organise l’information en lignes et colonnes</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 60%">
<h3 id="colonnes">Colonnes</h3>
<ul>
<li><i class="bi-file-earmark-person-fill " style="" role="img" aria-hidden="true"></i> <span style="color:green;">Variables d’identification</span> : ID animal, point temporel, condition (facteurs ou caractères).</li>
<li><i class="bi-dropbox " style="" role="img" aria-hidden="true"></i> <span style="color:green;">Variables d’analyse</span> : score, surface, nombre de cellules, etc. (numérique ou catégoriel).</li>
<li><i class="bi-device-ssd-fill " style="" role="img" aria-hidden="true"></i> <span style="color:green;">Variables créées</span> lors du traitement (proportions, ratios, etc.).</li>
</ul>
<h3 id="lignes">Lignes</h3>
<ul>
<li><i class="bi-clipboard-data-fill " style="" role="img" aria-hidden="true"></i> <span style="color:green;">Valeurs des variables</span> : entrées pour chaque colonne (variable). Chaque ligne correspond à une observation unique.</li>
</ul>
</div>
</div>
</div>
</div>
</section>
<section id="formats-de-tableaux-larges" class="slide level2 center">
<h2><i class="bi-file-earmark-spreadsheet " style="" role="img" aria-hidden="true"></i> Formats de tableaux larges</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 60%">
<div class="quarto-figure quarto-figure-left">
<figure>
<p><img data-src="images/Lewis_fig3-14.PNG" alt="Un diagramme illustrant la transformation entre les formats de données long et large. Le tableau de gauche représente un format long où chaque ligne contient un 'pays,' une 'année' et une valeur associée. Le tableau de droite montre le format large, où les années sont réparties sur plusieurs colonnes (ex. 'yr1960', 'yr1970', 'yr2010'). La fonction `pivot_wider()` transforme les données en format large, tandis que `pivot_longer()` effectue l'opération inverse, facilitant l'analyse des données longitudinales." width="600" height="350"></p>
<figcaption>Un tableau de données typique au format large, extrait de Lewis (2024). DOI: 10.1201/9781032622835-3</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: left;font-size: 70%">
<p>Dans un tableau au <span style="color:green;">format large</span>, <span style="text-decoration: underline;">chaque sujet</span> occupe une <span style="text-decoration: underline;">seule ligne</span> et les variables sont disposées en colonnes distinctes : <span style="color:orange;">sujet</span>, <span style="color:red;">Id1, Id2</span>, <span style="color:gray;">Var1, Var2</span>, <span style="color:magenta;">Temps 1, Temps 2, Temps 3</span>.</p>
</div>
<div class="smaller">
<div class="callout callout-tip callout-titled callout-style-default">
<div class="callout-body">
<div class="callout-title">
<div class="callout-icon-container">
<i class="callout-icon"></i>
</div>
<p><strong>Tip</strong></p>
</div>
<div class="callout-content">
<p>Ici, les colonnes représentent des <span style="color:green;">réponses ou prédicteurs</span> dans une régression. Exemple :</p>
<p><span style="color:green;">Cells_7D</span> ~ <span style="color:magenta;">Cells_2D + Cells_3D</span>.</p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="formats-de-tableaux-longs" class="slide level2">
<h2><i class="bi-file-earmark-spreadsheet " style="" role="img" aria-hidden="true"></i> Formats de tableaux longs</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 60%">
<div class="quarto-figure quarto-figure-left">
<figure>
<p><img data-src="images/Lewis_fig3-15.PNG" alt="Diagramme illustrant la transformation de données longitudinales de tableaux séparés en un format long. Les tableaux du haut et du bas représentent les « données de la première vague » et les « données de la deuxième vague », chacune contenant les mesures de l'anxiété (« anx1 » et “anx2”) pour les étudiants identifiés par « stu_id ». Le tableau de droite, intitulé « Long format data », restructure les données en ajoutant une colonne « vague », chaque ligne représentant les mesures d'un étudiant à une vague spécifique. Cette transformation optimise l'ensemble des données pour une analyse longitudinale et un stockage efficace." width="700" height="300"></p>
<figcaption>Un tableau de données typique au format long, extrait de Lewis (2024). DOI: 10.1201/9781032622835-3</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: left;font-size: 65%">
<p>Dans un tableau au <span style="color:green;">format long</span>, <span style="text-decoration: underline;">chaque sujet</span> occupe <span style="color:green;">plusieurs lignes</span> et possède des observations associées sur <span style="text-decoration: underline;">différentes lignes :</span></p>
<p><span style="color:orange;">sujet</span> (répété), <span style="color:red;">Id1, Id2</span> (répété), <span style="color:magenta;">Temps (1, 2, 3)</span>.</p>
</div>
<div class="smaller">
<div class="callout callout-tip callout-titled callout-style-default">
<div class="callout-body">
<div class="callout-title">
<div class="callout-icon-container">
<i class="callout-icon"></i>
</div>
<p><strong>Tip</strong></p>
</div>
<div class="callout-content">
<p>Utile pour l’analyse des <span style="color:green;">données temporelles</span>, regroupant différentes variables de condition en une seule colonne. <span style="text-decoration: underline;">Exemple :</span></p>
<p><span style="color:green;">Cells</span> ~ <span style="color:magenta;">PointTemps (1D, 2D, 3D)</span>.</p>
<p>Le format long est généralement privilégié pour l’analyse des données.</p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="le-meilleur-dans-tout-ça" class="slide level2 center">
<h2><i class="bi-balloon-heart-fill " style="" role="img" aria-hidden="true"></i> Le meilleur dans tout ça…</h2>
<div style="text-align: left;font-size: 80%">
<p>Vous pouvez utiliser R (ou Python) et <a href="https://quarto.org/">Quarto</a> pour convertir un tableau du format long au format large, et inversement.</p>
</div>
<div style="text-align: center;font-size: 60%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/LongToWide.png" alt="Diagramme illustrant la transformation entre les formats de données long et large en utilisant `pivot_wider()` et `pivot_longer()`. Le tableau de gauche représente des données au format long, où chaque ligne contient un « pays », une “année” et une valeur « métrique » correspondante. Le tableau de droite représente des données au format large, où les valeurs de l'année sont réparties sur plusieurs colonnes (par exemple, “yr1960”, “yr1970”, “yr2010”), chacune contenant la valeur métrique correspondante pour chaque pays. La fonction `pivot_wider()` convertit le format long en format large, tandis que `pivot_longer()` inverse le processus, démontrant ainsi la flexibilité de la mise en forme des données dans R." width="400" height="300"></p>
<figcaption>Conversion format long à large (https://tavareshugo.github.io/)</figcaption>
</figure>
</div>
</div>
<div class="smaller">
<div class="callout callout-tip callout-titled callout-style-default">
<div class="callout-body">
<div class="callout-title">
<div class="callout-icon-container">
<i class="callout-icon"></i>
</div>
<p><strong>Tip</strong></p>
</div>
<div class="callout-content">
<p>Consultez les <a href="(https://shanghai.hosting.nyu.edu/data/r/reshaping.html)">tutoriels R</a> et <a href="https://pandas.pydata.org/docs/getting_started/intro_tutorials/07_reshape_table_layout.html">python</a>.</p>
</div>
</div>
</div>
</div>
</section>
<section id="fournir-des-métadonnées-fichiers-readme" class="slide level2 center">
<h2><i class="bi-file-earmark-font-fill " style="" role="img" aria-hidden="true"></i> Fournir des métadonnées (fichiers README)</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: left;font-size: 80%">
<ul>
<li>Les ensembles de données sont <span style="color:red;">incompréhensibles</span> s’ils ne sont pas accompagnés de dictionnaires de données ou de codebooks <span style="color:green;">(.txt, .md, .csv)</span> décrivant les <span style="color:green;">variables</span> des tableaux de données. Cela peut également prendre la forme d’un <span style="color:green;">fichier README</span> <span style="color:green;">(.txt, .md)</span> qui décrit leur contexte et leur contenu.</li>
</ul>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 70%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/DescriptiveMetadata_czi.png" alt="Une capture d'écran de métadonnées descriptives pour un ensemble de données sur la réactivité des cellules PDGFR-B+ dans un modèle murin d'ischémie cérébrale. Le texte détaille l'origine des images, les conventions de nommage des fichiers, le contenu des dossiers et les conditions expérimentales. Il explique également le processus de génération des images à partir des fichiers Zenodo, leur traitement avec CellProfiler et fournit des liens vers des articles de recherche et des dépôts OSF pour plus d’informations." width="600" height="500"></p>
<figcaption>Exemple de fichier README</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section></section>
<section>
<section id="gestion-des-images" class="title-slide slide level1 agenda-slide center">
<h1>Gestion des images</h1>
<div class="agenda-heading">
<p>Agenda</p>
</div>
<div class="agenda">
<ol>
<li><div class="agenda-inactive agenda-pre-active">
<p>Principes pour la gestion des données de recherche</p>
</div></li>
<li><div class="agenda-inactive agenda-pre-active">
<p>Gestion des tableaux de données</p>
</div></li>
<li><div class="agenda-active">
<p>Gestion des images</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Organiser (et partager) les données</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Rédiger un fichier README</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Liste de contrôle pour une recherche reproductible</p>
</div></li>
</ol>
</div>
</section>
<section id="lors-de-la-gestion-des-images-veuillez-considérer" class="slide level2 center">
<h2><i class="bi-card-image " style="" role="img" aria-hidden="true"></i> Lors de la gestion des images, veuillez considérer :</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 60%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/BrainStaining.png" alt="Image de microscopie à fluorescence d'une section coronale de cerveau de souris. La section est marquée par des marqueurs d’immunofluorescence" width="500" height="250"></p>
<figcaption>Manrique-Castano et al. (2024). DOI: DOI 10.17605/OSF.IO/3VG8J</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<ul>
<li><i class="bi-card-image " style="" role="img" aria-hidden="true"></i> Convertissez les <span style="color:red;">fichiers propriétaires</span> (ex. .czi) en <span style="color:green;">formats ouverts</span> sans compression (.tif).</li>
<li><i class="bi-gear-fill " style="" role="img" aria-hidden="true"></i> Partagez les métadonnées <span style="color:green;">techniques</span> (paramètres d’acquisition) et <span style="color:green;">descriptives</span> (contexte et contenu) avec les images.</li>
<li><i class="bi-code-square " style="" role="img" aria-hidden="true"></i> Documentez toutes les procédures appliquées aux images (redimensionnement, soustraction de fond, etc.), par exemple en utilisant un <span style="color:green;">logiciel de codage/script</span>.</li>
<li><i class="bi-code-square " style="" role="img" aria-hidden="true"></i> Réalisez les analyses en utilisant un <span style="color:green;">logiciel de codage/script</span> pour garantir la reproductibilité. <span style="color:red;">Évitez l’analyse manuelle</span>.</li>
</ul>
</div>
</div>
</div>
</div>
<div class="smaller">
<div class="callout callout-tip callout-titled callout-style-default">
<div class="callout-body">
<div class="callout-title">
<div class="callout-icon-container">
<i class="callout-icon"></i>
</div>
<p><strong>Tip</strong></p>
</div>
<div class="callout-content">
<p>Consultez cette <a href="https://github.com/Alliance-RDM-GDR/RDM_BioimageFAIR">ressource</a> pour plus d’informations sur la gestion et le partage des images.</p>
</div>
</div>
</div>
</div>
</section>
<section id="convertir-les-images-en-formats-ouverts" class="slide level2 center">
<h2><i class="bi-card-image " style="" role="img" aria-hidden="true"></i> Convertir les images en formats ouverts</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 60%">
<div class="quarto-figure quarto-figure-left">
<figure>
<p><img data-src="images/Transform_czi-tif.png" alt="Capture d’écran d’un script macro ImageJ écrit en JavaScript. Le script automatise la conversion des fichiers d’imagerie microscopique `.czi` en format `.tif`. Il demande à l’utilisateur de sélectionner un répertoire, récupère la liste des fichiers `.czi`, et traite chaque fichier en l’ouvrant avec le Bio-Formats Importer. Il extrait ensuite deux canaux d’image et les enregistre séparément en tant que fichiers `.tif` dans un dossier 'Images_Tiff'. Le script garantit un traitement systématique de tous les fichiers et ferme toutes les fenêtres après l’exécution." width="500" height="300"></p>
<figcaption>Script FIJI pour enregistrer des images .czi en tiff. Extrait de Manrique-Castano et al. (2024). DOI: DOI 10.17605/OSF.IO/3VG8J</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: left;font-size: 70%">
<p>Vous pouvez facilement <span style="color:green;">convertir</span> vos fichiers propriétaires (.czi) en formats ouverts (.tif) en utilisant, par exemple, des <span style="color:green;">scripts FIJI</span> <a href="https://github.com/Alliance-RDM-GDR/RDM_OrganizeData/blob/main/resources/Transform_czi-tif.ijm">(lien)</a>.</p>
</div>
<div class="callout callout-caution callout-titled callout-style-default">
<div class="callout-body">
<div class="callout-title">
<div class="callout-icon-container">
<i class="callout-icon"></i>
</div>
<p><strong>Caution</strong></p>
</div>
<div class="callout-content">
<p>Enregistrer des images .czi en .tif avec FIJI entraîne une <span style="color:red;">perte de métadonnées</span> (archivées dans le fichier .czi).</p>
</div>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="suivre-les-métadonnées" class="slide level2 smaller">
<h2>Suivre les métadonnées</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<h4 id="techniques"><i class="bi-gear-fill " style="" role="img" aria-hidden="true"></i> <span style="color:gray;">Techniques</span></h4>
<p>Exportez les métadonnées techniques des images propriétaires (ex. .czi) en fichiers <span style="color:green;">.txt ou .csv</span> (cela peut être appliqué à toutes les images d’un lot).</p>
<div style="text-align: center;font-size: 70%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/TechnicalMetadata_czi.png" alt="Capture d’écran de la visionneuse de métadonnées affichant les métadonnées techniques d’un fichier d’imagerie microscopique `.czi`. Le tableau des métadonnées comprend des clés et des valeurs telles que 'BitsPerPixel' (14), 'DimensionOrder' (XYZCT), et 'PixelType' (uint16). D’autres détails indiquent que l’image contient 4 canaux (SizeC), un seul point temporel (SizeT = 1), des dimensions de 2752x2208 pixels (SizeX, SizeY), et un seul plan Z (SizeZ = 1). Ces métadonnées fournissent des informations essentielles pour le traitement et l’analyse d’images en microscopie de recherche." width="300" height="300"></p>
<figcaption>Exemple de métadonnées techniques dans FIJI : <em>image -> show info</em></figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<h4 id="descriptives"><i class="bi-file-earmark-pdf-fill " style="" role="img" aria-hidden="true"></i> <span style="color:orange;">Descriptives</span></h4>
<p>Générez des fichiers README descriptifs pour expliquer la <span style="color:green;">provenance et les conventions de nommage</span> des images.</p>
<div style="text-align: center;font-size: 70%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/DescriptiveMetadata_czi.png" alt="Une capture d'écran de métadonnées descriptives pour un ensemble de données sur la réactivité des cellules PDGFR-B+ dans un modèle murin d'ischémie cérébrale. Le texte détaille l'origine des images, les conventions de nommage des fichiers, le contenu des dossiers et les conditions expérimentales. Il explique également le processus de génération des images à partir des fichiers Zenodo, leur traitement avec CellProfiler et fournit des liens vers des articles de recherche et des dépôts OSF pour plus d’informations." width="400" height="330"></p>
<figcaption>Exemple de <a href="https://github.com/Alliance-RDM-GDR/RDM_OrganizeData/blob/main/resources/readme_images.txt">métadonnées descriptives</a></figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section></section>
<section>
<section id="organiser-et-partager-les-données" class="title-slide slide level1 agenda-slide center">
<h1>Organiser (et partager) les données</h1>
<div class="agenda-heading">
<p>Agenda</p>
</div>
<div class="agenda">
<ol>
<li><div class="agenda-inactive agenda-pre-active">
<p>Principes pour la gestion des données de recherche</p>
</div></li>
<li><div class="agenda-inactive agenda-pre-active">
<p>Gestion des tableaux de données</p>
</div></li>
<li><div class="agenda-inactive agenda-pre-active">
<p>Gestion des images</p>
</div></li>
<li><div class="agenda-active">
<p>Organiser (et partager) les données</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Rédiger un fichier README</p>
</div></li>
<li><div class="agenda-inactive agenda-post-active">
<p>Liste de contrôle pour une recherche reproductible</p>
</div></li>
</ol>
</div>
</section>
<section id="un-paysage-de-recherche-préoccupant" class="slide level2">
<h2>Un paysage de recherche préoccupant</h2>
<div style="text-align: left;font-size: 80%">
<p>Nous vivons une pandémie de <span style="color:red;">recherche frauduleuse et irréproducible</span>.</p>
</div>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: left;font-size: 60%">
<div class="quarto-figure quarto-figure-left">
<figure>
<p><img data-src="images/Economist_Retractions.png" alt="Un graphique de The Economist intitulé 'Pants on fire,' illustrant le nombre cumulé d’articles scientifiques biomédicaux rétractés de 1996 à 2023. Le graphique montre une augmentation exponentielle des rétractations, dépassant 15 000 en 2023. Les données proviennent de Retraction Watch et couvrent 4 244 revues évaluées. Ce graphique met en évidence les préoccupations croissantes concernant l'intégrité scientifique et l'augmentation du nombre de publications rétractées au fil du temps." width="450" height="450"></p>
<figcaption>Augmentation du nombre d’articles rétractés au cours des trois dernières décennies</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: left;font-size: 70%">
<p>Ce paysage préoccupant exige que, en tant que <span style="color:green;">chercheurs responsables</span>, nous appliquions de bonnes <span style="text-decoration: underline;">pratiques de recherche</span> pour partager les données et les procédures d’analyse.</p>
</div>
</div>
</div>
</div>
</section>
<section id="définir-la-structure-dun-ensemble-de-données" class="slide level2 center">
<h2>Définir la structure d’un ensemble de données</h2>
<p>Un <span style="color:green;">ensemble de données structuré</span> est la clé pour le comprendre et le réutiliser.</p>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 70%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/Matryoska.jpeg" alt="Un étalage de poupées russes traditionnelles Matriochkas, également appelées poupées gigognes, peintes dans des couleurs vives."></p>
<figcaption>Source : pexels.com</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 70%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/files.png" style="width:75.0%" alt="Un arbre de répertoires structuré représentant un projet de recherche organisé. Les dossiers de premier niveau incluent 'Code,' contenant des scripts R pour le nettoyage et l'analyse des données ('clean_raw_data.r,' 'analysis_1.r,' 'analysis_2.r'); 'Data,' divisé en 'Raw_data' (avec les fichiers bruts 'file_a.raw' et 'file_b.raw') et 'Processed_data' (contenant les fichiers CSV nettoyés 'file_a.csv' et 'file_b.csv'); 'Outputs,' qui comprend des sous-dossiers pour 'Figures' et 'Models'; ainsi qu'un fichier 'README.txt'. Cette organisation suit les bonnes pratiques pour la gestion des données de recherche."></p>
<figcaption>Structure des fichiers</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="principes-pour-structurer-un-ensemble-de-données" class="slide level2 center">
<h2>Principes pour structurer un ensemble de données</h2>
<p>Définissez une structure pour les données au <span style="color:green;">début</span> (idéal) ou <span style="color:green;">au cours</span> de votre recherche.</p>
<div class="callout callout-tip callout-titled callout-style-default">
<div class="callout-body">
<div class="callout-title">
<div class="callout-icon-container">
<i class="callout-icon"></i>
</div>
<p><strong>À considérer</strong></p>
</div>
<div class="callout-content">
<ul>
<li><i class="bi-folder-fill " style="" role="img" aria-hidden="true"></i> Dossiers/<span style="color:green;">structures de répertoires</span></li>
<li><i class="bi-filetype-tiff " style="" role="img" aria-hidden="true"></i> Réfléchissez aux <span style="color:green;">types/formats de fichiers</span></li>
<li><i class="bi-file-earmark-font-fill " style="" role="img" aria-hidden="true"></i> Établissez des <span style="color:green;">conventions de nommage</span> logiques et descriptives</li>
</ul>
</div>
</div>
</div>
<p>Dans l’ensemble, assurez-vous que la structure des données est <span style="color:green;">logique et cohérente</span>, compréhensible pour les utilisateurs externes.</p>
</section>
<section id="explorer-larborescence-des-dossiers" class="slide level2 center">
<h2><i class="bi-diagram-2-fill " style="" role="img" aria-hidden="true"></i> Explorer l’arborescence des dossiers</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<p><a href="https://www.projecttier.org/tier-protocol/protocol-4-0/root/">TIER 4.0</a> est un <span style="color:green;">modèle de projet</span> conçu pour standardiser les ensembles de données.</p>
<p><a href="https://github.com/Alliance-RDM-GDR/RDM_DepositingData/blob/main/resources/TIER4.0_DatasetTemplate.zip">Téléchargez</a> la structure du projet et adaptez-la à des cas spécifiques.</p>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/tier.png" style="width:40.0%" alt="Une structure de répertoires hiérarchique suivant le protocole TIER 4.0 pour l'organisation des données de recherche. Le dossier racine 'Project/' contient des documents clés tels que 'The Read Me File' et 'The Report.' Le dossier 'Data/' est divisé en 'InputData/' (avec les sous-dossiers 'Input Data Files' et 'Metadata,' incluant 'Data Sources Guide' et 'Codebooks'), 'AnalysisData/' (avec 'Analysis Data Files' et 'The Data Appendix') et 'IntermediateData/'. Le dossier 'Scripts/' comprend des sous-dossiers pour 'ProcessingScripts/', 'DataAppendixScripts/', 'AnalysisScripts/', ainsi que 'The Master Script.' Enfin, le dossier 'Output/' contient 'DataAppendixOutput' et 'Results.' Cette organisation garantit la transparence et la reproductibilité dans la gestion des données de recherche."></p>
<figcaption>Arborescence des dossiers</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="données-brutes" class="slide level2 center">
<h2><i class="bi-folder-fill " style="" role="img" aria-hidden="true"></i> Données brutes</h2>
<p>Un dossier <span style="color:orange;">Data_Raw/</span> peut contenir :</p>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<ul>
<li><span style="color:green;">Images originales</span> (.tiff, .czi)</li>
<li><span style="color:green;">Fichiers de sortie</span> des appareils de mesure (.txt, .csv)</li>
<li><span style="color:green;">Feuilles d’enregistrement</span> originales (.png, .csv, .xlsx)</li>
</ul>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/data_raw.png" style="width:90.0%" alt="Capture d'écran d'un répertoire structuré contenant des données organisées."></p>
<figcaption>Arborescence des dossiers</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="données-brutes---métadonnées" class="slide level2 center">
<h2>Données brutes - métadonnées</h2>
<p>Incluez des <span style="color:orange;">métadonnées/</span> permettant de comprendre et de réutiliser le contenu des fichiers :</p>
<ul>
<li><p><i class="bi-file-earmark-font-fill " style="" role="img" aria-hidden="true"></i> Détails méthodologiques et techniques.</p></li>
<li><p><i class="bi-file-earmark-font-fill " style="" role="img" aria-hidden="true"></i> Codebooks / dictionnaires de données expliquant les variables et unités. Ils peuvent être des fichiers <a href="https://osf.io/9n3gh">.txt</a> ou <a href="https://osf.io/925sh">.csv, xlxs</a>.</p></li>
<li><p><i class="bi-filetype-tiff " style="" role="img" aria-hidden="true"></i> Paramètres d’instrumentation et d’acquisition pour les images.</p></li>
</ul>
</section>
<section id="données-danalyse-traitées" class="slide level2 center">
<h2><i class="bi-folder-fill " style="" role="img" aria-hidden="true"></i> Données d’analyse (traitées)</h2>
<p>Un dossier <span style="color:orange;">Data_Analysis/</span> contient des <span style="color:green;">fichiers traités</span> utilisés pour générer les résultats de la recherche.</p>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<ul>
<li><p>Métadonnées similaires aux données brutes.</p></li>
<li><p>Fichiers <span style="color:green;">Data_Appendix</span> présentant des statistiques descriptives de base ou des distributions de données.</p></li>
</ul>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<div style="text-align: center;font-size: 50%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/data_processed.png" style="width:90.0%" alt="Capture d'écran d'un répertoire structuré contenant des données traitées organisées."></p>
<figcaption>Arborescence des dossiers</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="données-intermédiaires-optionnel" class="slide level2 center">
<h2><i class="bi-folder-fill " style="" role="img" aria-hidden="true"></i> Données intermédiaires (optionnel)</h2>
<p>Un dossier <span style="color:orange;">Data_Intermediate/</span> <i class="bi-folder-fill " style="" role="img" aria-hidden="true"></i> peut contenir des données intermédiaires traitées ou des fichiers prétraités dans le cadre d’un pipeline d’analyse. Par exemple, des “masques” d’image et des classificateurs d’apprentissage automatique utilisés pour un traitement ultérieur des images.</p>
</section>
<section id="le-script-est-la-voie-à-suivre" class="slide level2">
<h2><i class="bi-code-square " style="" role="img" aria-hidden="true"></i> Le script est la voie à suivre</h2>
<div style="text-align: left;font-size: 80%">
<p>Bien que la plupart des chercheurs soient plus à l’aise avec les interfaces graphiques (GUI), le paysage actuel de la recherche exige l’utilisation de <span style="color:green;">scripts et de code</span> pour garantir la reproductibilité des résultats de recherche.</p>
</div>
<img data-src="images/Theway.png" class="quarto-figure quarto-figure-center r-stretch" alt="Un mème humoristique sur le thème de la Guerre des étoiles comparant différents langages de programmation. L'image est divisée en trois sections, chacune montrant un personnage de Star Wars brandissant un sabre laser. À gauche, Luke Skywalker, avec un logo de langage de programmation « R », tient un sabre laser bleu. Au centre, Kylo Ren brandit un sabre laser rouge à garde transversale portant le logo GraphPad. À droite, Mace Windu, associé au logo Python, tient un sabre laser violet. Ce mème dépeint avec humour les rôles perçus des logiciels libres dans le paysage de la recherche."><div class="callout callout-tip callout-titled callout-style-default">
<div class="callout-body">
<div class="callout-title">
<div class="callout-icon-container">
<i class="callout-icon"></i>
</div>
<p><strong>Tip</strong></p>
</div>
<div class="callout-content">
<p><i class="bi-code-square " style="" role="img" aria-hidden="true"></i> Le codage doit être considéré comme une <span style="color:green;">compétence essentielle</span> au même titre que d’autres méthodes de recherche.</p>
</div>
</div>
</div>
</section>
<section id="outils-pour-gérer-le-code-et-les-scripts" class="slide level2 center">
<h2>Outils pour gérer le code et les scripts</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">
<div class="quarto-layout-row quarto-layout-valign-center">
<div id="first-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<h3 id="r-studioquarto-r-python"><i class="bi-code-square " style="" role="img" aria-hidden="true"></i> R-Studio/Quarto (R + Python)</h3>
<div style="text-align: center;font-size: 100%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/R-studio_Screen.jpg" alt="Capture d’écran d’une session RStudio affichant un carnet d’analyse de données Quarto." width="500" height="300"></p>
<figcaption>Écran R-Studio/Quarto</figcaption>
</figure>
</div>
</div>
</div>
<div id="second-column" class="quarto-layout-cell" style="flex-basis: 50.0%;justify-content: flex-start;">
<h3 id="github-contrôle-de-version"><i class="bi-github " style="" role="img" aria-hidden="true"></i> GitHub (Contrôle de version)</h3>
<div style="text-align: center;font-size: 100%">
<div class="quarto-figure quarto-figure-center">
<figure>
<p><img data-src="images/GitHub_screen.jpg" alt="Capture d’écran d’un dépôt GitHub nommé 'Stroke_PDGRF-B_Reactivity,' issu d’un fork de 'elalilab/Stroke_PDGRF-B_Reactivity.' Le dépôt est public et contient des répertoires tels que 'Data_Processed' ainsi que plusieurs fichiers Quarto Markdown (`.qmd`) liés à l’analyse de données" width="500" height="300"></p>
<figcaption>Écran GitHub</figcaption>
</figure>
</div>
</div>
</div>
</div>
</div>
</section>
<section id="avec-r-studio-r-et-python-vous-pouvez" class="slide level2 center">
<h2>Avec R-Studio (R et Python), vous pouvez</h2>
<div>
</div>
<div class="quarto-layout-panel" data-layout-ncol="2">