Fiabilité des statistiques d'utilisation des OS ?
Le
wedjat
Bonjour,
en me baladant sur un site fourni par P4nd1-P4nd4 à l'occasion de la
publication de statistiques sur l'utilisation de Linux et de Windows 7,
je trouve cette FAQ dans le but d'avoir plus de renseignements :
http://gs.statcounter.com/faq#methodology
Or, j'y lis la chose suivante : "As of 1 August 2009, our tracking code
is installed on approximately 3 million sites"
Or, le web d'aujourd'hui, d'après Netcraft, reçèle beaucoup plus
d'endroits où nicher :
http://news.netcraft.com/archives/2...urvey.html
Pas loin de 200 millions : VeriSign ne fournit pas un résultat très
éloigné, par ailleurs.
3 millions sur 200 millions, ça fait peu. Surtout quand on sait que tous
les hébergeurs ne proposent pas tous les OS disponibles sur le marché.
Sans compter que certains OS sont plus dirigés vers le service Web que
d'autres.
De plus, on ne compte pas ici les postes de travail, bien souvent
derrière un pare-feu donc non atteignables directement sur le réseau.
Ces derniers ne sont pas scannables.
Pour avoir des stats un peu plus solides, je pense à quelque chose comme
un lancement de nmap avec détection d'OS, généralisé sur l'ensemble des
routeurs, pare-feux, et serveurs web de l'internet. Or, une telle mesure
se heurte, vous vous en doutez, à nombre de problèmes :
- fermeture de ports,
- législation en vigueur dans certains pays, en particulier la France,
- mise en pratique et fiabilité des résultats obtenus à l'arrivée.
J'ouvre donc le débat suivant : quelle fiabilité accorder à de telles
statistiques sur l'utilisation des OS dans le monde ? Quelles méthodes
fiables utiliser ?
en me baladant sur un site fourni par P4nd1-P4nd4 à l'occasion de la
publication de statistiques sur l'utilisation de Linux et de Windows 7,
je trouve cette FAQ dans le but d'avoir plus de renseignements :
http://gs.statcounter.com/faq#methodology
Or, j'y lis la chose suivante : "As of 1 August 2009, our tracking code
is installed on approximately 3 million sites"
Or, le web d'aujourd'hui, d'après Netcraft, reçèle beaucoup plus
d'endroits où nicher :
http://news.netcraft.com/archives/2...urvey.html
Pas loin de 200 millions : VeriSign ne fournit pas un résultat très
éloigné, par ailleurs.
3 millions sur 200 millions, ça fait peu. Surtout quand on sait que tous
les hébergeurs ne proposent pas tous les OS disponibles sur le marché.
Sans compter que certains OS sont plus dirigés vers le service Web que
d'autres.
De plus, on ne compte pas ici les postes de travail, bien souvent
derrière un pare-feu donc non atteignables directement sur le réseau.
Ces derniers ne sont pas scannables.
Pour avoir des stats un peu plus solides, je pense à quelque chose comme
un lancement de nmap avec détection d'OS, généralisé sur l'ensemble des
routeurs, pare-feux, et serveurs web de l'internet. Or, une telle mesure
se heurte, vous vous en doutez, à nombre de problèmes :
- fermeture de ports,
- législation en vigueur dans certains pays, en particulier la France,
- mise en pratique et fiabilité des résultats obtenus à l'arrivée.
J'ouvre donc le débat suivant : quelle fiabilité accorder à de telles
statistiques sur l'utilisation des OS dans le monde ? Quelles méthodes
fiables utiliser ?

Poser une question


Si: Ce sont les postes de travail qui surfent et qui permettent d'etablir
les statistiques de "pandouille", et ce, meme si ils sont derriere un
"pare-feu".
Ce qu'on ne compte pas dans ces stats ce sont les machines qui ne surfent
pas, et là ou les chiffres sont faux c'est quand l'utilisateur change
l'User-Agent de son navigateur, chose qui arrive bien plus souvent qu'on
ne le crois.
Donc, d'abord, 3/200, ça ne couvre rien, mais en plus ça ne couvre que le
surf.
--
Architecte Informatique chez Blueline/Gulfsat:
Administration Systeme, Recherche & Developpement
+261 34 29 155 34 / +261 33 11 207 36
C'est vrai. Mais qu'en est-il de ceux se situant derrière un proxy ? La
requête HTTP est modifiée dans ce cas, non ?
En effet.
Par quel moyen par exemple ? Ca m'intéresse...
Peut-il donc y avoir des "instituts", si je puis me permettre, qui
sauraient rester crédibles au vu des méthodes employées ? Cela est-il
possible techniquement ? Économiquement ?
Selon les proxies.
http://www.google.com/search?q=fire...user+agent
Je comprend pas pourquoi tu n'a pas trouvé tout seul.
Oui.
Oui.
Oui.
--
Architecte Informatique chez Blueline/Gulfsat:
Administration Systeme, Recherche & Developpement
+261 34 29 155 34 / +261 33 11 207 36
Ça dépend si le proxy touche au champs User-Agent ou pas.
Ça dépend des navigateurs :)
Au niveau des serveurs web, il y a netcraft (qui n'a pas de stats d'OS),
woozweb (ils ont des stats d'OS mais leur échantillon est plus petit),
et sûrement d'autres.
http://news.netcraft.com/archives/2...urvey.html
http://www.woozweb.com/statisticstr...nuxwindows
Ces stats sont probablement faussées par le virtualhosting, et tu
n'auras jamais de stats sur tout un tas de services.
En gros des stats d'OS fiables, ya pas. Par contre ces chiffres vont pas
plaire à P4.
--
Vincent Riquer
BOFH excuse #81:
Please excuse me, I have to circuit an AC line through my head to get
this database working.
Un échantillonnage de 1,5% c'est plus que suffisant pour établir une
statistique fiable.
Le principe n'est pas de scanner l'internet, mais d'éplucher les requêtes
http venant des postes de travail qui surfent sur les sites équipés des
compteurs. Ces stats sont donc principalement des stats de postes de
travail, donc (desktop).
--
pehache
http://pehache.free.fr/public.html