Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Fréquences d'octets dans un texte francais

4 réponses
Avatar
NicoF
Bonjour,

Je voudrais savoir quelles sont les fréquences moyennes des octets dans un
texte francais. Je me doute qu'il y a une large part pour les minuscules,
les espaces, quelques CRLF etc. mais je cherche des valeurs de ces
fréquences sûres qui ont déjà prouvé leur efficacité.

Merci,
Nico

4 réponses

Avatar
Guillermito
"NicoF" wrote:

Je voudrais savoir quelles sont les fréquences moyennes des octets dans un
texte francais. Je me doute qu'il y a une large part pour les minuscules,
les espaces, quelques CRLF etc. mais je cherche des valeurs de ces
fréquences sûres qui ont déjà prouvé leur efficacité.


Ca dépend de l'auteur. Par exemple, si vous utilisez "La Disparition"
de Pérec comme texte en entrée, vous risquez d'avoir des surprises :)

Je viens de taper "fréquence lettres français" dans Google. Les
premières pages donnent ces fréquences (par lettre, par couple de
lettres, par trigramme):

Non accentuées:

http://www.jura.ch/lcp/cours/dm/codage/stat/francais.html

Accentuées:

http://www.jura.ch/lcp/cours/dm/codage/stat/francais2.html

Une autre source:

http://mantis.free.fr/articles/freq.htm

En anglais:

http://mantis.free.fr/articles/freq2.htm

Ces références n'incluent pas les codes ASCII ne représentant pas des
lettres. Je suppose que la fréquence des espaces est facile à déduire,
mais les CRLF dépendent de la façon dont le texte est structuré.

A la limite, si vous êtes programmeur, vous pouvez coder un petit
programme qui calculera tout ça. Vous pouvez aussi utiliser l'éditeur
hexa WinHex qui a une fonction de calcul de spectre intégrée. Il ne
restera plus qu'à trouver dans des sites spécialisés des centaines de
textes libres de droits pour nourrir la moulinette.

--
Guillermito
http://www.guillermito2.net

Avatar
bill
Alors Guigui les juges d'instruction c'est des c ?
Avatar
Ewa (siostra Ani) N.

Alors Guigui les juges d'instruction c'est des c ?



Vous avez l'air d'être un passionné de la crypto, vous...


--
Niesz !

Avatar
NicoF
"Guillermito" a écrit dans le message de
news:
"NicoF" wrote:

Je voudrais savoir quelles sont les fréquences moyennes des octets dans
un


A la limite, si vous êtes programmeur, vous pouvez coder un petit
programme qui calculera tout ça. Vous pouvez aussi utiliser l'éditeur
hexa WinHex qui a une fonction de calcul de spectre intégrée. Il ne
restera plus qu'à trouver dans des sites spécialisés des centaines de
textes libres de droits pour nourrir la moulinette.


Merci pour vos liens. J'ai écrit un petit programme dans le style, pour que
les fréquences utilisées correspondent vraiment à ce que je recherche.

Nico