From 6619d5ec753936404ea63ebab035c53f7192c8f9 Mon Sep 17 00:00:00 2001 From: norangebit Date: Mon, 14 Jun 2021 18:44:51 +0200 Subject: [PATCH] Refactor RQ4 --- src/chapter_3.md | 11 +++++++---- 1 file changed, 7 insertions(+), 4 deletions(-) diff --git a/src/chapter_3.md b/src/chapter_3.md index f11807f..d87c80c 100644 --- a/src/chapter_3.md +++ b/src/chapter_3.md @@ -224,11 +224,14 @@ Inoltre sono stati svolti dei test statistici (*ranksum* e *Cliff's delta*) per ### RQ4: come varia il livello di discussione tra ML bug e altri bug? Per rispondere a questa domanda è stato necessario andare a valutare il numero di commenti presenti all'interno di ogni issues. -Poiché un singolo commit può far riferimento a più issues è stato considerato il numero di commenti medi. +Questo dato non è presente nel dataset di partenze, ma può essere ricavato a partire dalla lista delle *issues* citate. +Per ogni *issue* citata si è calcolato il numero di commenti. +Poiché un singolo commit può far riferimento a più *issues* è stato calcolato il numero di commenti medi. -A questo punto si è cercato di capire se al maggior numero di commenti è associata effettivamente una maggiore quantità di informazioni scambiate. -Per svolgere questa analisi si è partiti dal presupposto che la quantità di informazioni scambiate sia proporzionale al numero di parole utilizzate nel commento. -Quindi per ogni *issue* è stato calcolato il numero medio di parole presenti all'interno di un commento. +Il livello della discussione non viene determinato solo dal numero di commenti, ma anche dalla lunghezza di questi. +Quindi per ogni *issue* è stato calcolato anche il numero medio di parole presenti all'interno di un commento. + +I dati per entrambe le distribuzioni sono stati valutati graficamente attraverso l'ausilio di un boxplot e attraverso i test statistici illustrati precedentemente. ### RQ5: come varia il time-to-fix tra ML bug e altri bug?