Pyparsing, problème caractères non ANSI

1 réponse
Avatar
Michel Claveau - MVP
Bonjour !

Je commence à débuter l'idée que je pourrais utiliser des parseurs.
Mais, si j'ai réussi à utiliser pyparser avec des accents, comme ça :

# -*- coding: utf-8 -*-
from pyparsing import Word,alphas,alphas8bit,unicodeString
alpha=alphas+alphas8bit

greet = Word(alpha) + Word(alpha) + Word(alpha) + "!"
hello = u"Bonjour à toi !"
print hello, "->", greet.parseString(hello.encode('cp1252','replace'))


je n'arrive à rien, dès qu'il y a un caractère Unicode tel que
l'euro (€), ou non ASCII étendu.

Quelqu'un aurait-il une idée ?

@+
--
Michel Claveau

1 réponse

Avatar
NicolasP
Bonjour !


Pareil

Je commence à débuter l'idée que je pourrais utiliser des parseurs.
Mais, si j'ai réussi à utiliser pyparser avec des accents, comme ça :

# -*- coding: utf-8 -*-
from pyparsing import Word,alphas,alphas8bit,unicodeString
alpha=alphas+alphas8bit

greet = Word(alpha) + Word(alpha) + Word(alpha) + "!"
hello = u"Bonjour à toi !"
print hello, "->", greet.parseString(hello.encode('cp1252','replace'))



Tu es sûr qu'ilfaut encoder les chaines unicode ?

je n'arrive à rien, dès qu'il y a un caractère Unicode tel que
l'euro (€), ou non ASCII étendu.



C'est quoi rien ?

Quelqu'un aurait-il une idée ?

@+



Nicolas