diff --git a/src/chapter_2.md b/src/chapter_2.md index 86fa5b8..7b02df9 100644 --- a/src/chapter_2.md +++ b/src/chapter_2.md @@ -82,7 +82,7 @@ Mentre le performance del primo modello sono state valutate sull'intero dataset. \subfloat[Numero di issues rispetto alla fase\label{fig:labeling-phases}]{% \includegraphics[width=0.45\textwidth]{src/figures/count-phases.pdf} } - \caption{Risultati della classificazione manuale} + \caption{Risultati della classificazione manuale delle issues} \label{fig:labeling} \end{figure} @@ -101,7 +101,9 @@ Dalla @fig:labeling-type si evince la natura minoritaria delle issues di \ac{ML} Prima di poter classificare i commit si è reso necessaria un'ulteriore fase di filtraggio in modo da poter separare i commit di *issue fixing* da quelli generici. Sono stati considerati come commit di *fix* tutti quei commit al cui interno veniva fatto riferimento a delle issues attraverso la notazione *"#"*. -Questa operazione ha ridotto il dataset dei commit a $3321$ unità. +Questa operazione ha ridotto il dataset dei commit a $3321$ unità la cui distribuzione in base al tipo è riportata in @fig:count-commit. + +![Risultato della classificazione dei commit](figures/count-commit.pdf){#fig:count-commit} A questo punto è stato possibile separare i *fix* di \acl{ML} e quelli generici. La classificazione è avvenuta attraverso la lista delle issues citate all'interno del *commit message* e sono stati considerati come commit di \ac{ML} tutti quei commit che facevano riferimento ad almeno una issue di \ac{ML}. diff --git a/src/figures/count-commit.pdf b/src/figures/count-commit.pdf new file mode 100644 index 0000000..60e2c6e Binary files /dev/null and b/src/figures/count-commit.pdf differ