Fréquences d'octets dans un texte francais

Le
NicoF
Bonjour,

Je voudrais savoir quelles sont les fréquences moyennes des octets dans un
texte francais. Je me doute qu'il y a une large part pour les minuscules,
les espaces, quelques CRLF etc. mais je cherche des valeurs de ces
fréquences sûres qui ont déjà prouvé leur efficacité.

Merci,
Nico
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Guillermito
Le #435275
"NicoF"
Je voudrais savoir quelles sont les fréquences moyennes des octets dans un
texte francais. Je me doute qu'il y a une large part pour les minuscules,
les espaces, quelques CRLF etc. mais je cherche des valeurs de ces
fréquences sûres qui ont déjà prouvé leur efficacité.


Ca dépend de l'auteur. Par exemple, si vous utilisez "La Disparition"
de Pérec comme texte en entrée, vous risquez d'avoir des surprises :)

Je viens de taper "fréquence lettres français" dans Google. Les
premières pages donnent ces fréquences (par lettre, par couple de
lettres, par trigramme):

Non accentuées:

http://www.jura.ch/lcp/cours/dm/codage/stat/francais.html

Accentuées:

http://www.jura.ch/lcp/cours/dm/codage/stat/francais2.html

Une autre source:

http://mantis.free.fr/articles/freq.htm

En anglais:

http://mantis.free.fr/articles/freq2.htm

Ces références n'incluent pas les codes ASCII ne représentant pas des
lettres. Je suppose que la fréquence des espaces est facile à déduire,
mais les CRLF dépendent de la façon dont le texte est structuré.

A la limite, si vous êtes programmeur, vous pouvez coder un petit
programme qui calculera tout ça. Vous pouvez aussi utiliser l'éditeur
hexa WinHex qui a une fonction de calcul de spectre intégrée. Il ne
restera plus qu'à trouver dans des sites spécialisés des centaines de
textes libres de droits pour nourrir la moulinette.

--
Guillermito
http://www.guillermito2.net

bill
Le #435274
Alors Guigui les juges d'instruction c'est des c ?
Ewa (siostra Ani) N.
Le #435171

Alors Guigui les juges d'instruction c'est des c ?



Vous avez l'air d'être un passionné de la crypto, vous...


--
Niesz !

NicoF
Le #435065
"Guillermito" news:
"NicoF"
Je voudrais savoir quelles sont les fréquences moyennes des octets dans
un


A la limite, si vous êtes programmeur, vous pouvez coder un petit
programme qui calculera tout ça. Vous pouvez aussi utiliser l'éditeur
hexa WinHex qui a une fonction de calcul de spectre intégrée. Il ne
restera plus qu'à trouver dans des sites spécialisés des centaines de
textes libres de droits pour nourrir la moulinette.


Merci pour vos liens. J'ai écrit un petit programme dans le style, pour que
les fréquences utilisées correspondent vraiment à ce que je recherche.

Nico


Publicité
Poster une réponse
Anonyme