diff --git a/src/chapter_2.md b/src/chapter_2.md index 854832e..86fa5b8 100644 --- a/src/chapter_2.md +++ b/src/chapter_2.md @@ -74,13 +74,26 @@ Le fasi considerate sono: A partire dal dataset *labellato* è stato possibile costruire un training e un test set, mediante i quali è stato possibile allenare e valutare le performance del modello bayesiano. Mentre le performance del primo modello sono state valutate sull'intero dataset. +\begin{figure}[!ht] +\subfloat[Numero di issues rispetto al tipo\label{fig:labeling-type}]{% + \includegraphics[width=0.45\textwidth]{src/figures/count-type.pdf} + } + \hfill +\subfloat[Numero di issues rispetto alla fase\label{fig:labeling-phases}]{% + \includegraphics[width=0.45\textwidth]{src/figures/count-phases.pdf} + } + \caption{Risultati della classificazione manuale} + \label{fig:labeling} +\end{figure} + Al fine di poter confrontare i due modelli sono state utilizzate le metriche di precision e recall. -Com'è possibile notare dai valori riportati in @tbl:confronto-modelli-classificazione-issues, il modello... +Com'è possibile notare dai valori riportati in @tbl:confronto-modelli-classificazione-issues, il modello basato sulla lista di vocaboli è leggermente più preciso del modello bayesiano, ma presenta una recall decisamente più bassa. +Dalla @fig:labeling-type si evince la natura minoritaria delle issues di \ac{ML} rispetto alle issues generiche, per questo motivo si è scelto di preferire il modello naïve Bayes in modo da perdere quante meno istanze possibili anche a costo di sacrificare leggermente la precisione. | | Classificatore statico | naïve Bayes | |-----------|------------------------|-------------| -| precision | XX | XX | -| recall | XX | XX | +| precision | 0.46 | 0.41 | +| recall | 0.74 | 0.94 | : Confronto dei due modelli per la classificazione delle issues. {#tbl:confronto-modelli-classificazione-issues} diff --git a/src/figures/count-phases.pdf b/src/figures/count-phases.pdf new file mode 100644 index 0000000..3ab1ecb Binary files /dev/null and b/src/figures/count-phases.pdf differ diff --git a/src/figures/count-type.pdf b/src/figures/count-type.pdf new file mode 100644 index 0000000..011358a Binary files /dev/null and b/src/figures/count-type.pdf differ