This commit is contained in:
Raffaele Mignone 2021-06-08 21:15:10 +02:00
parent 4ed2559b5d
commit 97c5ab4f6e
Signed by: norangebit
GPG Key ID: F5255658CB220573

View File

@ -2,11 +2,10 @@
## RQ1: come il ML e' distribuito sull'architettura dei progetti?
In questa prima analisi si è voluto andare a vedere se esiste una differenza tra cambiamenti generici e cambiamenti legati al \ac{ML} rispetto ai file e le directories toccati da questi cambiamenti.
In questa prima analisi si è andato a verificare l'esistenza di una differenza nei files e nelle directories modificate in base al tipo di cambiamento.
Per poter svolgere questa analisi è stato necessario individuare il numero totale di file modificati per *fix* generici e per i *fix* specifici del \acl{ML}.
Per fare ciò, i commit sono stati raggruppati rispetto al progetto e al tipo di cambiamento (\ac{ML}, no \ac{ML}).
Per ogni ogni istanza di questo raggruppamento si è eseguito l'union set dei files modificati.
Come output di questa fase, per ogni progetto, si è ottenuto:
A tal fine i commit sono stati raggruppati rispetto al progetto e al tipo di cambiamento (\ac{ML}, no \ac{ML}) e per ogni istanza di questo raggruppamento si è eseguito l'union set dei files modificati.
Come output di questa fase si è generato per ogni progetto:
- l'insieme dei file modificati per *fix* di \ac{ML}
- l'insieme dei file modificati per fix generici
@ -29,7 +28,7 @@ Mentre in un secondo caso sono state incluse anche librerie utilizzate spesso in
![Percentuale di file che utilizzano librerie di ML](figures/imports.pdf){#fig:imports width=70%}
Dal boxplot riportato in @fig:imports si può notare che, indipendentemente dalla severità dell'analisi, la percentuale di file che utilizzano librerie di \acl{ML} è caratterizzata da una forte varianza.
Ciò ci indica che i progetti inclusi all'interno dello studio sono vari tra di loro.
Ciò indica che i progetti inclusi all'interno dello studio sono di varia natura e che alcuni sono più incentrati sul \ac{ML} rispetto ad altri.
Inoltre, considerando l'analisi *strict*, è possibile osservare come solo un $25\%$ dei progetti abbia una percentuale di files di \ac{ML} superiore al $45\%$.
## RQ2: come sono distribuiti i bug sulle diverse fasi di ML?