OVH Cloud OVH Cloud

Fiabilité des statistiques d'utilisation des OS ?

54 réponses
Avatar
wedjat
Bonjour,

en me baladant sur un site fourni par P4nd1-P4nd4 à l'occasion de la
publication de statistiques sur l'utilisation de Linux et de Windows 7,
je trouve cette FAQ dans le but d'avoir plus de renseignements :
http://gs.statcounter.com/faq#methodology

Or, j'y lis la chose suivante : "As of 1 August 2009, our tracking code
is installed on approximately 3 million sites"

Or, le web d'aujourd'hui, d'après Netcraft, reçèle beaucoup plus
d'endroits où nicher :
http://news.netcraft.com/archives/2008/12/24/december_2008_web_server_survey.html

Pas loin de 200 millions : VeriSign ne fournit pas un résultat très
éloigné, par ailleurs.

3 millions sur 200 millions, ça fait peu. Surtout quand on sait que tous
les hébergeurs ne proposent pas tous les OS disponibles sur le marché.
Sans compter que certains OS sont plus dirigés vers le service Web que
d'autres.
De plus, on ne compte pas ici les postes de travail, bien souvent
derrière un pare-feu donc non atteignables directement sur le réseau.
Ces derniers ne sont pas scannables.

Pour avoir des stats un peu plus solides, je pense à quelque chose comme
un lancement de nmap avec détection d'OS, généralisé sur l'ensemble des
routeurs, pare-feux, et serveurs web de l'internet. Or, une telle mesure
se heurte, vous vous en doutez, à nombre de problèmes :
- fermeture de ports,
- législation en vigueur dans certains pays, en particulier la France,
- mise en pratique et fiabilité des résultats obtenus à l'arrivée.


J'ouvre donc le débat suivant : quelle fiabilité accorder à de telles
statistiques sur l'utilisation des OS dans le monde ? Quelles méthodes
fiables utiliser ?

10 réponses

1 2 3 4 5
Avatar
Professeur M
Le Tue, 05 Jan 2010 20:53:08 +0100, P4nd1-P4nd4 a écrit :

les
résultats sont contunuellement pondérés en fonction de calculs
statistiques qui offrent une marge d'erreur assez (enfin très...) faible



Ça m'intéresse ça : vous pouvez développer ?

- pourquoi pondérer ?
- comment pondérer ?
- comment évaluer la marge d'erreur ?
Avatar
yl
In article <4b43be75$0$913$,
Professeur Méphisto writes:
Le Tue, 05 Jan 2010 20:53:08 +0100, P4nd1-P4nd4 a écrit :

les
résultats sont contunuellement pondérés en fonction de calculs
statistiques qui offrent une marge d'erreur assez (enfin très...) faible



Ça m'intéresse ça : vous pouvez développer ?

- pourquoi pondérer ?
- comment pondérer ?
- comment évaluer la marge d'erreur ?



La marge d'erreur est inférieure au biais, voyons :))


Il suffit de diminuer le biais pour réduire la marge d'erreur.

--
http://mikeread.tripod.com/archive.htm
Avatar
Dellara
P4nd1-P4nd4 a papoté sur Usenet le janvier 5, 2010
02:53 PM:

Bien, il est rare de trouver des machines derrière un proxy, ce n'est
plus très utilisé...Quoique !


Mouaaaaaarrrrrffff!
Avatar
leeed
Le 05-01-2010, P4nd1-P4nd4 <P4nd1-P4nd4@> a écrit :

Bien, il est rare de trouver des machines derrière un proxy, ce n'est
plus très utilisé...Quoique !




Ce qu'il ne faut pas lire...

Dans certaine grande structure, dont la nôtre, nous utilisons bien un
proxy, sous Windows évidemment ;>))




Vu la connerie que tu as bavouillé précedemment, ta "grande structure"
ne doit exister que dans tes rêves. Miam le proxy sous windows, tu
devrais l'appeller une passoire.


Tous les siteys présentés ont une assez bonne fiabilité, car les
résultats sont contunuellement pondérés en fonction de calculs
statistiques qui offrent une marge d'erreur assez (enfin très...)
faible



Et donc, dans ta grande structure, ils ont embauché un "abrupti" (©P4)
comme toi, qui ne sait même pas écrire 3 lignes sans faute d'orthographe
ni faute de frappe. Faudrait qu'ils pensent à changer de DRH :)
Avatar
JKB
Le 06-01-2010, ? propos de
Re: Fiabilité des statistiques d'utilisat,
leeed ?crivait dans fr.comp.os.linux.debats :
Le 05-01-2010, P4nd1-P4nd4 <P4nd1-P4nd4@> a écrit :

Bien, il est rare de trouver des machines derrière un proxy, ce n'est
plus très utilisé...Quoique !




Ce qu'il ne faut pas lire...

Dans certaine grande structure, dont la nôtre, nous utilisons bien un
proxy, sous Windows évidemment ;>))




Vu la connerie que tu as bavouillé précedemment, ta "grande structure"
ne doit exister que dans tes rêves. Miam le proxy sous windows, tu
devrais l'appeller une passoire.



Malheureusement, ça existe (et ça n'emmerde que les gens honnêtes).
Je rencontre même trop souvent des proxy sous Windows qu'il faut
administrer par VNC !

Tous les siteys présentés ont une assez bonne fiabilité, car les
résultats sont contunuellement pondérés en fonction de calculs
statistiques qui offrent une marge d'erreur assez (enfin très...)
faible



Et donc, dans ta grande structure, ils ont embauché un "abrupti" (©P4)
comme toi, qui ne sait même pas écrire 3 lignes sans faute d'orthographe
ni faute de frappe. Faudrait qu'ils pensent à changer de DRH :)



JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.
Avatar
debug this fifo
P4nd1-P4nd4 wrote:


Un des plus recommandés est



et ta bloguerie, elle est sous linux ?
Avatar
debug this fifo
P4nd1-P4nd4 wrote:

Bien, il est rare de trouver des machines derrière un proxy, ce n'est
plus très utilisé...Quoique !



mais tu vis dans un univers parallele ?

Dans certaine grande structure, dont la nôtre, nous utilisons bien un
proxy, sous Windows évidemment ;>))



pourquoi "evidemment" ?


Mais la plupart de ces machines derrière un proxy, c'est des machines
professionnelles, donc des Windows !



pourquoi "donc des windows" ?


Par quel moyen par exemple ? Ca m'intéresse...



Comme personne sait faire cela, et que de surctoit cela ne sert à rien
,cela n'a pas d'influence dans les statistiques...



non, TU ne sais pas faire, et tu NE sais PAS à quoi ça sert. nuance.

résultats sont contunuellement pondérés en fonction de calculs
statistiques qui offrent une marge d'erreur assez (enfin très...) faible



sources ? references ?
Avatar
Nicolas George
"pehache-tolai" , dans le message , a
écrit :
Un échantillonnage de 1,5% c'est plus que suffisant pour établir une
statistique fiable.



Non. La fiabilité d'un échantillon dépend plus de sa taille absolue que de
sa taille relative.

Et ce, bien sûr, en supposant que l'échantillon est aléatoire, ce que tu
n'as pas prouvé.
Avatar
Doug713705
Dans fr.comp.os.linux.debats P4nd1-P4nd4 nous expliquait:

Bien, il est rare de trouver des machines derrière un proxy, ce n'est
plus très utilisé...Quoique !



Le "quoique" c'est pour pouvoir dire tout et son contraire dans la même
phrase ?

Dans certaine grande structure, dont la nôtre, nous utilisons bien un
proxy, sous Windows évidemment ;>))



Pauvres de vous, ça doit être terrible de bosser avec une connexion au
net aussi peu fiable.

--
@+
Doug - Linux user #307925 - Slackware64 roulaize ;-)
[ Plus ou moins avec une chance de peut-être ]
Avatar
Doug713705
Dans fr.comp.os.linux.debats leeed nous expliquait:

Dans certaine grande structure, dont la nôtre, nous utilisons bien un
proxy, sous Windows évidemment ;>))




Vu la connerie que tu as bavouillé précedemment, ta "grande structure"
ne doit exister que dans tes rêves. Miam le proxy sous windows, tu
devrais l'appeller une passoire.



Quand en plus tu ajoutes la secrétaire qui "gère" les
comptes utilisateurs (dixit P' himself), tu immagines tout de suite la
structure en emmental !
Un emmental un peu particulier quand même, il y'a plus de trous que
de fromage dans celui là.

--
@+
Doug - Linux user #307925 - Slackware64 roulaize ;-)
[ Plus ou moins avec une chance de peut-être ]
1 2 3 4 5