J'écris un petit utilitaire pour mettre en page du texte (issu de
binaire après divers strings/grep). Ce texte contient certaines scories
sans intérêt, mais gênantes. En effet, je viens d'avoir droit à un :
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position
3812-3814: invalid data".
Existe-t-il une fonction simple permettant de virer les caractères
indésirables ?
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
JB BUTET
it te suffit de faire attention aux exceptions..
try : tumetstoncodeici except UnicodeDecodeError: tu fais ce que tu veux là
A+
JB
Bonjour,
J'écris un petit utilitaire pour mettre en page du texte (issu de binaire après divers strings/grep). Ce texte contient certaines scories sans intérêt, mais gênantes. En effet, je viens d'avoir droit à un : "UnicodeDecodeError: 'utf8' codec can't decode bytes in position 3812-3814: invalid data".
Existe-t-il une fonction simple permettant de virer les caractères indésirables ?
D'avance merci
it te suffit de faire attention aux exceptions..
try :
tumetstoncodeici
except UnicodeDecodeError:
tu fais ce que tu veux là
A+
JB
Bonjour,
J'écris un petit utilitaire pour mettre en page du texte (issu de
binaire après divers strings/grep). Ce texte contient certaines scories
sans intérêt, mais gênantes. En effet, je viens d'avoir droit à un :
"UnicodeDecodeError: 'utf8' codec can't decode bytes in position
3812-3814: invalid data".
Existe-t-il une fonction simple permettant de virer les caractères
indésirables ?
try : tumetstoncodeici except UnicodeDecodeError: tu fais ce que tu veux là
A+
JB
Bonjour,
J'écris un petit utilitaire pour mettre en page du texte (issu de binaire après divers strings/grep). Ce texte contient certaines scories sans intérêt, mais gênantes. En effet, je viens d'avoir droit à un : "UnicodeDecodeError: 'utf8' codec can't decode bytes in position 3812-3814: invalid data".
Existe-t-il une fonction simple permettant de virer les caractères indésirables ?
D'avance merci
kato fong
it te suffit de faire attention aux exceptions..
try : tumetstoncodeici except UnicodeDecodeError: tu fais ce que tu veux là
c'est justement pour éviter de faire ça qu'une fonction comme:
Si le problème apparaît à l'encodage (ou à la lecture d'un fichier encodé), tu peux utiliser les paramètres 'ignore' ou 'replace' (par défaut, c'est 'strict')
-- @-salutations
Michel Claveau
Bonjour !
Si le problème apparaît à l'encodage (ou à la lecture d'un fichier
encodé), tu peux utiliser les paramètres 'ignore' ou 'replace' (par
défaut, c'est 'strict')
Si le problème apparaît à l'encodage (ou à la lecture d'un fichier encodé), tu peux utiliser les paramètres 'ignore' ou 'replace' (par défaut, c'est 'strict')
-- @-salutations
Michel Claveau
kato fong
Si le problème apparaît à l'encodage (ou à la lecture d'un fichier encodé), tu peux utiliser les paramètres 'ignore' ou 'replace' (par défaut, c'est 'strict')
Finalement, j'ai juste rajouté aux endroits critiques :
text2 = rawText.decode("utf-8","replace")
et ça marche.
Merci
-- kf
Si le problème apparaît à l'encodage (ou à la lecture d'un fichier
encodé), tu peux utiliser les paramètres 'ignore' ou 'replace' (par
défaut, c'est 'strict')
Finalement, j'ai juste rajouté aux endroits critiques :
Si le problème apparaît à l'encodage (ou à la lecture d'un fichier encodé), tu peux utiliser les paramètres 'ignore' ou 'replace' (par défaut, c'est 'strict')
Finalement, j'ai juste rajouté aux endroits critiques :
text2 = rawText.decode("utf-8","replace")
et ça marche.
Merci
-- kf
Méta-MCI
Merci
De rien ; ça fera 1 000 000 000 000 ¤ ; et, c'est moi qui te dirai merci...
Merci
De rien ; ça fera 1 000 000 000 000 ¤ ; et, c'est moi qui te dirai merci...