Nous nous intéressons aux performances de \(206\) processeurs (Central Processor Unity, CPU en anglais), en fonction de diverses covariables listées ci-dessous:

Nous donnons ci-dessous les trois premières lignes du tableau de données:

library(MASS)
## Warning: package 'MASS' was built under R version 3.5.3
head(cpus)
##             name syct mmin  mmax cach chmin chmax perf estperf
## 1  ADVISOR 32/60  125  256  6000  256    16   128  198     199
## 2  AMDAHL 470V/7   29 8000 32000   32     8    32  269     253
## 3  AMDAHL 470/7A   29 8000 32000   32     8    32  220     253
## 4 AMDAHL 470V/7B   29 8000 32000   32     8    32  172     253
## 5 AMDAHL 470V/7C   29 8000 16000   32     8    16  132     132
## 6  AMDAHL 470V/8   26 8000 32000   64     8    32  318     290

On cherche à modéliser la performance perf comme une combinaison linéaire des covariables syct , mmin, mmax, cach,chmin et chmax. Le modèle est implémenté sous par le code suivant:

attach(cpus)
names(cpus)
## [1] "name"    "syct"    "mmin"    "mmax"    "cach"    "chmin"   "chmax"  
## [8] "perf"    "estperf"
res_lm <- lm(perf~ syct + mmin + mmax + cach + chmin + chmax)
summary(res_lm)
## 
## Call:
## lm(formula = perf ~ syct + mmin + mmax + cach + chmin + chmax)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -195.84  -25.17    5.41   26.53  385.75 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -5.590e+01  8.045e+00  -6.948 4.99e-11 ***
## syct         4.886e-02  1.752e-02   2.789  0.00579 ** 
## mmin         1.529e-02  1.827e-03   8.371 9.42e-15 ***
## mmax         5.571e-03  6.418e-04   8.680 1.33e-15 ***
## cach         6.412e-01  1.396e-01   4.594 7.64e-06 ***
## chmin       -2.701e-01  8.557e-01  -0.316  0.75263    
## chmax        1.483e+00  2.201e-01   6.738 1.64e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 59.99 on 202 degrees of freedom
## Multiple R-squared:  0.8649, Adjusted R-squared:  0.8609 
## F-statistic: 215.5 on 6 and 202 DF,  p-value: < 2.2e-16
  1. Ecrire le modèle correspondant à l’instruction \(\textsf{R}\) précédente (on donnera la taille des objets).

  2. Pourquoi pensez-vous que la variable n’a pas été incluse dans le modèle. On pourra utiliser les corrélations entre les variables, représentées ci dessous

library(ggcorrplot)
## Warning: package 'ggcorrplot' was built under R version 3.5.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 3.5.3
corr <- round(cor(cpus[,-1]), 1)
ggcorrplot(corr, hc.order = TRUE, type = "upper",outline.col = "white")

  1. Les hypothèses sur les résidus sont-elles respectées ? Indiquer le graphique utilisé et jutifier les réponses.
par(mfrow=c(2,2))
plot(res_lm)

  1. Donner les hypothèses du test du modèle global. Rappeler l’expression de la statistique de test, sa loi sous \(H_0\). Donner la valeur de sa réalisation ici. Conclure

  2. Quel est le test fait sur la ligne min du summary.