From cf91cd0f718c3398e82bbc09f36132d54060dcf1 Mon Sep 17 00:00:00 2001 From: norangebit Date: Mon, 7 Jun 2021 11:15:15 +0200 Subject: [PATCH] Add RQ2 --- src/chapter_2.md | 4 ++-- src/chapter_3.md | 22 ++++++++++++++++++++++ src/figures/count-fix-phases.pdf | Bin 0 -> 12519 bytes 3 files changed, 24 insertions(+), 2 deletions(-) create mode 100644 src/chapter_3.md create mode 100644 src/figures/count-fix-phases.pdf diff --git a/src/chapter_2.md b/src/chapter_2.md index e859dc0..f0c0325 100644 --- a/src/chapter_2.md +++ b/src/chapter_2.md @@ -36,7 +36,7 @@ Con il processo precedentemente illustrato è stato possibile recuperare: ## Classificazione dei dati -### Classificazione delle issues +### Classificazione delle issues {#sec:classificazione-issues} Al fine di poter eseguire un confronto tra i *fix* di \ac{ML} e quelli *generici* è stato necessario classificare sia le issues che i commit. Per quanto riguarda i primi si è scelto di attuare una classificazione basata sul testo, in particolare considerando il titolo e il corpo della issue, ma escludendo i commenti di risposta in modo da non rendere i dati troppo rumorosi. @@ -98,7 +98,7 @@ Dalla @fig:labeling-type si evince la natura minoritaria delle issues di \ac{ML} : Confronto dei due modelli per la classificazione delle issues. {#tbl:confronto-modelli-classificazione-issues} -### Classificazione dei commit +### Classificazione dei commit {#sec:classificazione-commit} Prima di poter classificare i commit si è reso necessaria un'ulteriore fase di filtraggio in modo da poter separare i commit di *issue fixing* da quelli generici. Sono stati considerati come commit di *fix* tutti quei commit al cui interno veniva fatto riferimento a delle issues attraverso la notazione *"#"*. diff --git a/src/chapter_3.md b/src/chapter_3.md new file mode 100644 index 0000000..c60ff22 --- /dev/null +++ b/src/chapter_3.md @@ -0,0 +1,22 @@ +# Analisi + +## RQ1: come il ML e' distribuito sull'architettura dei progetti? + +## RQ2: come sono distribuiti i bug sulle diverse fasi di ML? + +Come illustrato nella @sec:classificazione-commit per poter determinare la natura del *issue fix* si è fatto ricorso alla classificazione delle issues ad esso linkate. +Nel caso in cui la issue sia stata classificata manualmente, oltre all'individuazione della tipologia (\ac{ML}, non \ac{ML}) è stata individuata anche la fase in cui il problema si palesava (si veda @sec:classificazione-issues). +Questo dato aggiuntivo presente su alcune issues è stato *proiettato* anche sulla classificazione dei commit di *fix* per andare come questi sono distribuiti sulle varie fasi. +I risultati di questa analisi sono riportati in @fig:count-fix-phases. + +![Istanze dei fix in base alla fase](figures/count-fix-phases.pdf){#fig:count-fix-phases} + +Rispetto alla distribuzione sulle issues (@fig:labeling-phases) è possibile notare la scomparsa della fase *data collection*, inoltre è evidente anche la riduzione delle occorrenze di *model training* e una crescita di importanza per quanto riguarda le fasi di *model requirements* e *model deployment*. +Sfortunatamente i dati disponibili per questa analisi sono molti limitati, è stato possibile ricavare la fase solo per quaranta *fix*, per cui non è stato possibile altre analisi. + +## RQ3: esiste una differenza di entropy tra ML bug e altri bug? + +## RQ4: come varia il livello di discussione tra ML bug e altri bug? + +## RQ5: come varia il time-to-fix tra ML bug e altri bug? + diff --git a/src/figures/count-fix-phases.pdf b/src/figures/count-fix-phases.pdf new file mode 100644 index 0000000000000000000000000000000000000000..7c74811020ce4f7c3e069fb333e15b1195311365 GIT binary patch literal 12519 zcmb_@2{@GB7qCJ!MAj1Nl_cxz!`QMf*$t5`+gOUBF(lP5WX+OY6e1L!|uFh4nf1|jvlz?$kmdySvH9%Kh0 zN$!p=9uzl-urS=p*l8cxnFh(xC;vkZ`fmo*C=_p+FN8)dP@n;*AyWW=xG;wf)!WYp zf;rV7K}b!qzlSr~Ob4tEewkApDZW0AR5Hc+&@bi}@WEP0L$Zs9qq=thpdOwZOIT=t zOcQtr?U&HZ$iCiwRA(SXSWLgA2n+Tv5yIsBlDW2rCy)|^)b<2o)FeB5y8x*hkST67 zcL=?p3P6A_jY@X(LIj*i*{$!}ug!k@{goOt(dAan?UNt2eb^>fk?}gGi&3fzpYo|uN@Ro5Nd>zR&hvDXh}2`*X1%z5NHL#W_wf_mxnj&l83!cf=a6J6gg zuAhDJM)~wa-wW-t-DU!)9q06q;Y`iMuVv<4OCUsLdLiBRwxg(OW80==5@{tDpL6zx zByNl)sceju-gt3N?eJA;c|#F>>v6&c>pF^PAc{AiEn{a)R&}ChL$=vaYT$|SW=@wt zV$#j9=&{hC+5|a5aCyrcU3WWP_M!bLVw~v@Lc|QD4=eB{$BYSSyl@(W&b6rLc1mZLuYR>EZ6^PGovFJcPwMW80GhVG4s66gFPd9PAwbq4@At zcpS1Sg7%Dshfhpldp@S>K8;`6(W$Si_H2HZN2U7C0&>hFvHYZOn-sbuR^<^5qZ}1v zwZqU7adbRl$MazSqg@Al@|(5o-t?PoxkO9KlCrq6H7sjXB$k!!$*X}65qkM1B8IGf zd9P%^#7T(V;R6R6`gbWhvFcdZ6vZStKJ?BnI#2zS6({IhZ!;sZj_}_0X|^7AFz0+5 zZ=RlwneE5iA0kXy9GL8rR)ekPew9@#f4pf}_)_g^R+>dtAsKhl_@E!# z!A})4uZNnx7`R4Cy)vkHZVas%l#bt#(k^-_WP}UbwE2@h?$d11(L#>4E`P3d3T=IY zJ%t@@Ii=g?3?==dNHK3ic5Uty^0z2cw%nvCRl37aynW_Gf?6N@>O<2=DWg8AcBG+1 z!HIVpf{7FN^cvSZ_B^3<61BZ2uJ=nw$e=|8qT9>P5IZfMSbwk?KecK5Ow`klhndOq zZgB$!jK{i=_IZ|VL^uisvw_hqw@3(rN7MI@Df8+D_Z>>u6m#@wabA`__^v4*n z@Z{y2BfZS2*3Syi6YXC$u6@7q%5>ke+jA@#GT++F&+h9-6y#AF=OZSwzr)V+=N|s) zM(KMSb^=5^_Lpm=`z;t|1KItC!47XF&H|5yJ+55ie_a2RNDSgx_$#Be8O-R@;b{M*(4FF%Dv$t_x2IZ>a&h-TNA zRSA<_U-P9e>to)I%2Q8|^^1$WJ|Wb{ueC3=(qIosI3AZ2dhGS2Pif|qqG!9S>oe=z zw5XTKqaA!s6S+tF?rYoa5pR4G>Z(vNW=h<^LNF}Kz9^kPC>y}hvpvgZhHGba$64V= zc-ggbG|O{j37m7$*JBS4e~ZC9+h<_sX?F4O7A1R4i?J~lov5wOX&Xj|)z-e=Rp)LU znQ~BzQEg(XyyfuPiT-qeN3m*;x-tG9nHkrJEM z?G49L#V6eFzIt@;Mf{Jau}u0WFT0C;e0GJ>E$dKCQqXd8F`^cGL|Yimn(%hrtiQ#+ z{*$MchJ)8R~jQQ zINT!HYb6*`nMGJbXR~sVlSLzz%I$e(dkiM-tZS>@CS@J=im_`okIp2w#&}c;&lb!P z-;FnRwGKOW;Nr6cBTBGzq}cs89V z@eELV)Vz)B+PY}*R9_L(xgx=f3bGDKVlSqH2F|9q9tkwl<3b%jQrzr*e>I^asmg7` z-3)zUtvE~EsS-s!{AAGVi|e;%2?tJo-0(T<;LyAj$I+hED#sY~f7q@0S9lmWMz3Vg zV6d1)!o!>DQ5sO}RbTnO)i88VREsyBjhLD5F>B#vRTaB_L(IupbTtzFnHV|nIT3$u z`+sg!%Wu-gVLEk}p6T%hr#-j#4`~&=OWw(W-BO*l`$68_B=&n+1Z5>IOt08_1yt1< zzh2iTQMW~&mx-FSX{UDea8Ey!WNIN@A9@|a?RD{s@7H2Budh#djQkJ3(R;}gIhtBr zLmuW!YP4FTYBA*spr${Q2vI-nnCyiRni1lOoMsJe$)4(nUo}T$}o>T_D$IB!k8~Gv%B- zMYGR@w~@(s`1V4l0K|ly<#78S*vHn{JN7yc&~F5YLK!KhrPmPyCPLEgKl`m0__I~+w|F^qjOHa^SaA&E4r+H9Tq zpC5P1;KtF7+-Yvd1cqGZ=U9G3SZ`fMg76_>B@)CE@rxyBrcY^9W$hp3wLSZA@^t$l zGmF9MuipDL%nBu|qtJIzM_b}=zSOtlJ`mPiVSm|1so;pLjdl8=$g1dAF_r5BX%iyX z?P#*4@|$(0*f5!rnitxNI&(g&r-re_8%^f0)g2}N7)A!w_LQu<@mv|BRmNTn+={Br>qspK;o@{<8KF)0$ z&mF!&Hzy&7(ax)@E(@4zrXC(|iY$C^A*NchLB-hc%Z^k7nca6OB!Ru(l4Bknp)pGq z;--?PIxNaM*sP)sanBIH>3$yV_7n+Mpma|~z1)Ir#Be`w&?h?Nqz&sl>)+$Yb$Rp6 z8xLr~TT;4x49egBckh$&4_d!$7Su(h6apEW~@YDu5`(!jB0Ic zt>b#G?%Dc#jGMkwtJmYs@84Q(we|EhC(YOsp1#Vrn7R$#Hxj$+dFnjhXLjdY#bPBz zLY`EH?|ZB2Uv~SW&-Lt`*s)x%WpoN30#~9_G?uVPr-mohI2h5ajPDPHWvfD}0qwgj zIQ!@K>i7D0u?aT^d77>X7K;do5PaU*&pD(;;By;3v)4?*N#vBVPd17q6f1FX%K2o_ zf#iMC=iLMB^&c44Z;(02Ba?qAElI%p#zfkzPKsB;I<0mYHuWCQ#5qhb%aM(zbo_=r z@|y-{Jg>}rV|d_+(_4li_~^P4hKNgIaBMAC4aCYcZ?3i$fp}uPJqbjS*!7qr4x=0s zq0DU84{2{aFKgndSjzP9O1OPdd!cq;?(jNYJy87|7#3G|%C- zJ^sR>PUp;7Hs`ORO3P3QpO9BVB^I~Xd24~Kq={zjzeDl~)_tB9|FOIX&eCj78$51% zw${Njpp{hM(o%9$OmtgMvhmTa8pQ?QaMW#E3qI?uW%f@w*|cB3ICebY0&n({55uL? z+68@l)}JOi^V@Pw+gk1s@2$_t;;X!R_z_3nWT35X<@@9|5uw(3lVEA`AQd5|X47$S zoNI`4^W_k!5XX}Jvd7<%F^}fIMDW|bKRWBwBpbwEJbJs9gWQw|kHMYoDT< zb$$3>t%4L1T%X;!^R6U9H;3WnQ zdzbo47tdWtefL@^WX4U4svYwvT3$gU(fT1V*K>m(f#U0MS9r4O_4LyIqT^My!U3P;mdqWGH!mIle z{L?Oc58WkNz%4z>dkA&3d8*Cj`s;(l-HL+DyjnX>HCv38uD+;9YDnK7wePJndE`cy z;+jUm2X@3lmjmZw{LK9%eGJ-DKA8^A`R_?Ss>4A>^cMRHc|L3Ls^2KCefrV_$7~d2 zEKbsCdL(fzX4Jpu|( zldw%A1z*D-+;m8*I&ScOZfAGlOH(zRMk<7EC;t)A0GU_tPDxLE`DC;O3Ui ztZi>d19Jq$+{()4A9+m!#XbK?jaxW+?9p#sTaj7is=9W7M0|2ldFK{{!pt(ft~fD8 zFE$%xlbf+jX!cgSuuWDqf$s|4_@ng;=BIV%X0~?nYne&n(-S3-e#v5cNKX}xq&9FI z3V%s)A&5z8A(KkPW;+lcjz+!WogI9fTBdd15GxeigAI5)D_rt?H^W#47EX8tnuWVU^@pi2D*4c>%Aj#v13tM603 z>#mSaiYHLKZ@;iVQ^>){C6t&^Eox^~D$C8~fmbtZud$X1s;aR6Ay_V2$*wvR)o>ug zEH3BHexLky{%h(`Z?nnC7nk zB4;YuCbfk;D@ycku6(HxVU*%AMd@g}Qu^Z@`)dDr6Z7?##7cMFw|z({#pxmY>g8k8 z_Fsz|Ej%2$=Ul+#aBr7H@M~pEt!vpWBI=^@1CDs38+Wg~=~7JD#u!x@|4}_3@mBbe zSnf%w{!?a|Mlvrqre%*EJ`%^E-1szhptGrULyYz{nG2o!Qsg;NJfzN)0~Zs5lX=!? zxanBp*z)hS1ghifVu?BFx9WWy7+cFi^YSm5RdbS8jjgtOqA-lx6%xl#H?$+>)0Z_x z-|XdBuN|zSL zqr0?q<77F#HtBm-D#@vnB2I)9?vHwtd@;S?K1tfJZ}&81+lmf1!3KHMA$)IeqnQL^uDNYYmSi`2+%9SP6?vZAD_IhN z%G|p1YKHsyy_G@%ZzWjNdk0dg0>RDXMC=;p`_i@t3$JD}2pQ1QqhhS8*EMyCu&=Yv zSX1oN9eWBY6%@_qv}Y0MDmkbn>{qez!)=?p$yJZrkD4BRW%q6iYptO8=fkU71numX zk==?jJ#bO}_pOvxJdqn@dQ85zLd11#LuQLxuho8;FJ$S~$$h;VCsfIA*b>O=uJXE6 zJEyW^|CscyM9o_M#LXt>og)=@=o;ucC+c1oJ}#PJRc3c8-CVNF?0LCIW8IxT>&N#r zV|`-3MZI2Q{>}J}ZSthy@hgewFB{FP6_3a0eYV#cutvZ8p@}LLm|5$swVgRMsaBEyXWPaOH09Qj79O8i8M4hN9(>I=8^4oA?yCV%Yh{ZibZ)PLY~IH_S^SbyWLa}Zf9wpx!lWTR<)Wp z>?Zbs@ADm9yS2;t{Rz7JY(2f>zFY0;2&33)pAe1DF5IegHm~{qcEpR5XN0MejE-+I zF4L%j76;B}-N&DfuE6TKzP+tmnqGIvPQL61JIVFhA@O!tdjOU z;=7DmR-E#JtDwK_4-ZmaW{~o>OWaV+pEQ2(v8X8eHaI=<+~PApISfl6_dL|U{Yb1o zzkbAK%dA+b`qPu|GVYr-&hnS>w#!`6Y3HhtK`@!}C|ji?`L;f4pB_`V;Ik_`*pjt^ zSFrlH9>ei{pILfI_Qj2UCdwq9S41FTWh?NP__s!WGQ_k}e=0~rb$RQIihw)eH zBHx)N+12|@q_!Po?R5Vk$lvnJnJ+O&=X@#mIuH4p$eJvB`9}MXJVcI~NaxH9X?AD# z?dJpIqG~#_%JLoWHVIpQ`p9Yi`bfkwidboOyCghg3FRiJpn6`7%Q%M3uNcjinR%so zDjK`kJ!_rR=U@^63FDdExSFOdqX#gr!+hu81!YoroR!1OgKvi9D9i3=%;ei5B5?gf zMPX{3)*cn}K(pPP&Ceo=@3x8zoRyvo(US}pF^N94DM5xzsR-&Pth;(Og_Ivx5`7MJ za;DsqPk3*x%~rp}oyQv_kpsh(oA2d!S3S**zI`lj6?*M5+^jtPU3^B9G1a3osw%k`)4jR?AN^^{-?B0asj>CoNii8!N&U?V5#vOB6JC;D@{hE(FNej1# zy?`F~mGRo!ZYaOMW8A8EY9v|M?trZL24u0&^d|!222+pXDOKH??-b5YzE_im0`x~8 z@OKR#Zfl;ZGk0h_-9u3&Jbp1$9Xb3p=E~^k+&9L(4mOeh$`H5WyjO0qFE)(VNv1XmgX`R6DM_AXt<^fa(>Y%Ki_;q zr2(xrm@8wI=HJwJpWC+%gI;}IySYy(w}!LHmX+HjZOiQ%Xsg}Hx!oW4Bu%$hC=Q;i zEO*_joLdt$&e~YA$};GCWmB+z-JE^bNSdUWGf%`+@SCk>1jU^7*UZPMMJLJzPfPjm zO@Hgun0Uv0O;l-U8MarN0?RGFD8pXEnW0Qj1P1N`S8YVW_E*0@0Fm8Y5UwwM1omV| zSXnU$Yf9iV@QeTe!mP!D@{4&7iXM!!<$?| zC^&P{sX3`z&Dmrc`rT$c6qjn0&DFxPe`Hn2^H`+F=Uk*f=ruM@$*;P!Ud?rGeA{^H zuSic8o#FHH731mKV{ooat#$g+JMZJdl{*LHgb>RRxYFDXz2r(n`D86eJ&IN1{TyOm zHLq79=ZNw7eGwD$S48!z*aBBO$Aoos2o`13hdZ1eZhRthT{Je*o zbrJ%d{I4Rh8&^wBxRNrI>rr;bM}Stb~;!mtgfhO9#JXmqPA~SJhJ|@$cUw&^|i|_4>Q=KGh*(n8yYn1 zVJnc|P_qn8D@~9v=*8xVHzjg_!|3=d-w)MoF~|Vp+#PK{?zF{p?iQ}K4KGg?NuM%H zx*+nBq!O4ed!}-r=l(w2Xll8PZ_thF)yPYUHBqjS$7?-K-B^{Ov`V9=^Ma|y2H}oJ z`J^2s157F>Dkz+T&ewv|u8WLDK~6gaq}AFAwRrfw+QswmcfhgiY1+HNd!+oksT+gW ztlBLv)HBvInWAjGy_3d=d2|uqx^XR!)>fstxPr$#Z>@0;G2D;taux4mtXBMvGGbuh zIncV=C3{zL*+_$T>2%o|%P&7xW$T!y{wp8A^`FZ*bw^(^y+Q`mp6qkn?MDJ7C!iL^ z-H{3x$AG$(pS3Pp6i@~N*S;tzA&{CLuC8RbECm#m*g)We6%v%GID?8Cc?cOurg}qo z6ojN51U-1=3aU>aJPzP^1VDHKgd}^oxr3q^EU2u3h;k6p5kfjaNM{7n1-t|J5Yi2l z%itlT2k5|zo)FRtLQ){4H-z+okOv?ns7(Pxf>Iqn2Qow2f5E9hL1cHy$KdXd( z6AW@Kq_zjumj*KhI7hXeG$exqw-RVMaAS(bfXEFhXkZjgvad7M!-wWg zh0w5-gL)wtZ0Ja%0!Bd5jVuZU`$6#U_Y)Xu;P`VT3?8sxZT@WYW3nmzTBZC2V z*>LfWn=jDK0@W+vcPXhrJ)q9Y!&!~u=1GQ7py0?cfKDKw4+r#0qLICJ!}9#Y!CxXn zTKy*MFFt#ZXHh4Uk1lXw@*kp3@fB+PDhI{xu7BoAmam2mJ6 z6f7c`Y?w8;2aT>5c)5j!!2i_Q@2M6Z0D%irU;xKp7#^kyQ2xsdeyQtM4^#%OpcbS= zp8+R_hS{c*58J`-`C%-WC%Q2KgMxqmo&_cfg+kEZ{hWYEAVR+yYzPZB0NcUhMwd0P z3)m+9YIJ*mZQ@s>+saRyfbHS$2Gd3V4d#Gt<5z<@C!p{^hk#bt29{|=d7u;6EUp*`opmzklhoApybX_mJhjD&4*e+nL!u_ABqQ4K&dcYsUJ{OJ-K#24wCkPE6 zSpdu#qL)*ECl?54mJTCB7&rw4UV6bH0!7o|t`LUqy?+KGpm#dh4Z_eP8ysaYKbP`^ zF!ZGmAl?A)O2?x>^t)}als7Pz1(**U^5}050JC0rqC$W_It(~n`Wgs&zynsk0Hp^= z;0WlyKtbwHrr;X3WPv`&B7BLY;g-L z{c*FuyewQ*strta>H9^|1iesvss<+f6*+%b&?23I^x?}2q#EWI8v6f^24nt=Sn!fR zzyJLK{-xkQz`suGe}FK{zdj#oc>95%2A0+LaDmeeV7oByAk;1do`nkGKVxx!ErZkm zHL5fZZ;B>d5WGWE0R!Saihz;>`Gq{1D22j^qfp`!hy^?l>34we?&IlA^Yn0n{IRk) zS+q3dPNVtwDj<? zLjhO26ow=Gi%0lZrZ_p+fx&;j?FG#CuUzmLkl`-H!~e?%ULIuSOYjI7I4Ony{;Wa3 z!CP$!OdkIao*d?1JUQ&Y_9BOeUESjOo>7TtE~Yh|IjbVb?@|CV2#c6VT5u)Q(gdeXFC< OI3f`tCZ=Vqjrc#ke^uN7 literal 0 HcmV?d00001