diff --git a/bibliography.bib b/bibliography.bib index 1beed2f..f4dfdf4 100644 --- a/bibliography.bib +++ b/bibliography.bib @@ -192,22 +192,6 @@ langid = {english} } -@inproceedings{han2020empiricalstudydependencya, - title = {An {{Empirical Study}} of the {{Dependency Networks}} of {{Deep Learning Libraries}}}, - booktitle = {2020 {{IEEE International Conference}} on {{Software Maintenance}} and {{Evolution}} ({{ICSME}})}, - author = {Han, Junxiao and Deng, Shuiguang and Lo, David and Zhi, Chen and Yin, Jianwei and Xia, Xin}, - date = {2020-09}, - pages = {868--878}, - publisher = {{IEEE}}, - location = {{Adelaide, Australia}}, - doi = {10.1109/ICSME46990.2020.00116}, - abstract = {Deep Learning techniques have been prevalent in various domains, and more and more open source projects in GitHub rely on deep learning libraries to implement their algorithms. To that end, they should always keep pace with the latest versions of deep learning libraries to make the best use of deep learning libraries. Aptly managing the versions of deep learning libraries can help projects avoid crashes or security issues caused by deep learning libraries. Unfortunately, very few studies have been done on the dependency networks of deep learning libraries. In this paper, we take the first step to perform an exploratory study on the dependency networks of deep learning libraries, namely, Tensorflow, PyTorch, and Theano. We study the project purposes, application domains, dependency degrees, update behaviors and reasons as well as version distributions of deep learning projects that depend on Tensorflow, PyTorch, and Theano. Our study unveils some commonalities in various aspects (e.g., purposes, application domains, dependency degrees) of deep learning libraries and reveals some discrepancies as for the update behaviors, update reasons, and the version distributions. Our findings highlight some directions for researchers and also provide suggestions for deep learning developers and users.}, - eventtitle = {2020 {{IEEE International Conference}} on {{Software Maintenance}} and {{Evolution}} ({{ICSME}})}, - file = {/home/norangebit/Documenti/10-personal/12-organizzation/07-zotero-attachments/IEEE/Han_2020_An Empirical Study of the Dependency Networks of Deep Learning Libraries.pdf}, - isbn = {978-1-72815-619-4}, - langid = {english} -} - @article{han2020whatprogrammersdiscuss, title = {What Do {{Programmers Discuss}} about {{Deep Learning Frameworks}}}, author = {Han, Junxiao and Shihab, Emad and Wan, Zhiyuan and Deng, Shuiguang and Xia, Xin}, diff --git a/src/chapter_2.md b/src/chapter_2.md new file mode 100644 index 0000000..f635063 --- /dev/null +++ b/src/chapter_2.md @@ -0,0 +1,19 @@ +# Collezione dei dati + +L'individuazione dei progetti da analizzare è avvenuta mediate l'ausilio dell'\ac{API} messa a disposizione da GitHub. +In particolare è stata eseguita una query per ottenere una lista di repository che fanno uso di librerie e framework di \ac{ML} come `TensorFlow`, `Pytorch` e `scikit-learn`. +In questo modo è stato possibile ottenere una lista di $26758$ repository che è stata successivamente filtrata per individuare solo i progetti d'interesse per la seguente analisi. + +L'operazione di filtraggio è avvenuta attraverso due fasi; una prima automatica e una seconda manuale. +La prima fase è servita per selezionare unicamente i repository *popolari*. +Nella maggior parte dei casi viene utilizzato il numero di stelle come indice di popolarità dei progetti [@borges2016understandingfactorsthat], ma per questo lavoro si è preferito dare maggiore rilevanza al numero di fork, al numero di *contributors* e al numero di issues chiuse. +Questa scelta è stata dettata dall'esigenza di selezionare non solo repository popolari, ma anche caratterizzati da una forte partecipazione. + +I progetti che hanno superato questa prima selezione dovevano: + +- essere lavori originali, per cui sono stati esclusi tutti i fork. +- avere almeno cento issues chiuse. +- avere dieci contributors. + +Alla fine di questa prima selezione sono rimasti solo sessantasei repository che sono stati analizzati manualmente per rimuovere listati associati a libri e/o tutorial, progetti non in lingua inglese e librerie. +Alla fine di questa seconda fase solo rimasti trenta progetti. diff --git a/src/metadata.yaml b/src/metadata.yaml index ac8e485..98c3255 100644 --- a/src/metadata.yaml +++ b/src/metadata.yaml @@ -18,4 +18,11 @@ numbersections: true eulerchapternumber: true floatnumbering: true ############# +ac-onlyused: true +ac-title: Acronimi +acronym: + - short: API + long: Application Program Interface + - short: ML + long: Machine Learning ---