diff --git a/src/chapter_4.md b/src/chapter_4.md index 1fc586d..127d07a 100644 --- a/src/chapter_4.md +++ b/src/chapter_4.md @@ -177,3 +177,12 @@ Le problematiche di \acl{ML} richiedono più tempo per essere risolte. La bassa priorità di una \emph{issue} e la presenza di \emph{work around} sono fattori che contribuiscono a ritardare l'intervento di \emph{fix}. \end{tcolorbox} +## Threats to validity + +La *threats to validity* più critica per il lavoro svolto riguarda la classificazione delle *issues*. +La classificazione è avvenuta in modo automatico attraverso un modello *naïve Bayes*. +Il classificatore, sebbene sia caratterizzato da una *recall* molto elevata, presenta una *precision* discreta per cui è molto probabile che all'interno tra le *issues* di \ac{ML} siano state incluse anche *issues* generiche. +Inoltre, poiché la classificazione degli interventi di *issue fixing* dipende dalla classificazione degli *issues*, gli eventi di *misclassification* sono stati propagati anche su questa seconda classificazione. + +Per quanto riguarda le *threat to validity* esterne va sicuramente segnalato che i risultati di questo lavoro si generalizzano unicamente per i trenta progetti inclusi nel dataset. +