9  Révision (a)

Dans cette révision, on pratique l’interprétation des résultats statistiques et, dans la deuxième partie de la révision, on examine les données utilisées dans le deuxième questionnaire. Vous êtes donc déjà familiarisé.e avec les données. L’idée sera de commencer un rapport pour simuler ce que vous devez faire pour le projet A.

9.1 Interprétation de résultats

Jusqu’ici on a exploré les ANOVAs, qui sont un type spécifique de régression linéaire, ainsi que les régression linéaires traditionnelles. La pratique ci-dessous révise quelques points importants sur l’interprétation des résultats statistiques.

Pratique

Examinez les deux tableaux ci-dessous et répondez aux questions suivantes. Les données en question impliquent des auxiliaires en hollandais. Il y en a trois dans l’étude ici : hebben, zijn, et zijnheb. L’objectif ici est de vérifier si la fréquence écrite (WrittenFrequency) d’un mot (la variable de réponse ici) est affecté par l’auxiliaire qui l’accompagne.

Tableau 9.1. Résultats de l’analyse A (régression traditionnelle)
Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)        6.4943     0.0803  80.881  < 2e-16 ***
Auxiliaryzijn      1.2434     0.4387   2.834  0.00472 ** 
Auxiliaryzijnheb   0.3636     0.2063   1.763  0.07840 .  
Tableau 9.2. Résultats de l’analyse B (ANOVA)
             Df Sum Sq Mean Sq F value  Pr(>F)   
Auxiliary     2     39   19.50   5.241 0.00551 **
Residuals   697   2593    3.72 

Question 1. Les analyses sont-elles comparables? Ses résultats sont en accord par rapport à l’effet de l’auxiliaire?

Question 2. Interprétez et rapportez le résultat de l’ANOVA dans le Tableau 9.2. Effectuez des comparaisons multiples à partir de la méthode Tukey et comparez les résultats à ceux de la régression dans le Tableau 9.1. Qu’est-ce que vous remarquez?

Question 3. L’intercept de la régression est significatif. Qu’est-ce que cela vaut dire? Combien d’observations avons-nous dans les données analysées ici?

Question 4. Parmi les trois auxiliaires dans les données, quelle différence n’est pas explicitement déterminée dans le Tableau 9.1? Comment pourriez-vous générer cette différence?

9.2 Qmd ou R?

Bien que le format Quarto soit parfait pour composer de différents documents académiques, les scripts R sont toujours importants :

  • Script : pour explorer nos données, créer des graphiques, élaborer/exécuter/examiner des modèles statistiques, etc. On peut même avoir plus d’un script (un script pour importer et nettoyer les données, un autre script pour les visualisations, etc.). Après avoir créé notre analyse dans un script, on est prêt à décider quels éléments seront choisis pour l’étape finale : le rapport.
  • Quarto : le document qui communique notre analyse et nos résultats. Vu qu’on a déjà créé nos codes dans le script, on peut simplement copier et coller les blocs de code pertinents et, naturellement, travailler sur notre texte, nos références bibliographiques, etc. Ici, vos codes seront masqués (#| echo: false). Pour nos projets, on utilise le format pdf.

9.3 Le projet A

Dans nos deux projets (A et B), vous soumettrez votre ficher PDF seulement. Toutefois, vos projets auront des fichiers suivants :

  • un script R pour votre analyse
  • un fichier bib pour vos références
  • un ficher Qmd pour votre article
  • un fichier PDF (le résultat)

C’est essentiellement la structure d’un projet de recherche traditionnel —sauf qu’en réalité on a tendance à utiliser plusieurs scripts. Le script est important car on l’utilise pour l’exploration de données, ce qui nous permettra de choisir les meilleures figures et les meilleurs modèles pour le document final.

Lisez attentivement les instructions pour le projet sur monPortail. Téléchargez le modèle (Qmd et pdf) pour examiner la structure du fichier et posez vos questions sur le forum du monPortail.


Pratique

Pour répondre aux questions suivantes, vous pouvez créer un script pour explorer les données dans le fichier q2-danois.csv. Ensuite, créez un fichier PDF avec Quarto. Dans ce document, vous répondrez les question en format de texte selon l’information fournie ci-dessous. Simplement dit, la pratique ici implique la transformation du questionnaire 2 en un petit document PDF qui présente une analyse de données quantitative. Les question sont ici juste pour vous guider. Comme d’habitude, essayez de développer votre code avant de consulter vos notes et les codes déjà utilisés.

Question 5. Introduction. Dans cette section, expliquez la structure des données qui seront utilisées. Vous pourriez également ajouter quelques informations sur la langue en question, ce qui pourrait être supplémenté avec une référence. Idéalement, votre introduction termine avec la question de recherche qui sera examinée dans votre analyse. Cela produit une bonne transition vers la section suivante. Vous pouvez citer l’origine des données, qui sont adaptées à partir de l’étude Morphological effects in auditory word recognition: Evidence from Danish. Vous devez consulter Google Scholar pour accéder à la référence complète en format bib.

Question 6. Méthodes. Ici, vous expliquez quels seront les outils utilisé dans l’analyse, ce qui exige des citations. Par exemple, il faut dire que les données seront examinées avec une régression linéaire.

Question 7. Résultats. C’est la section parfaite pour ajouter des figures et les interpréter selon la question posée dans l’introduction. Attention : vous n’avez pas encore d’analyse statistique. Donc, votre interprétation doit être prudente.

Question 8. Analyse.1 Vous donnez votre modèle statistique dans cette section-ci. En plus, vous pouvez y ajouter des comparaisons multiples. Finalement, il faut interpréter les résultats du modèle.

Question 9. Conclusion. C’est un petit paragraphe qui résume ce que vous venez de faire : comment les résultats peuvent-ils répondre à la question posée dans l’introduction? C’est dans cette section qui les questions pour la recherche future sont normalement mentionnées.

Remarquez la logique entre les questions : les sections dans votre analyse doivent être bien connectées de façon cohérente. Une question nous amène à une méthode d’analyse, qui à son tour produit des résultats qui seront interpréter par rapport à la question.


  1. Dans vos projets, les résultats et l’analyse seront dans la même section.↩︎