A mon avis le plus propre est de tout passer en unicode non ?
Pour les chaînes littérales, je suis complètement d'accord.
Bon, mais du coup, est-ce qu'il existerai pas un script pour mettre automatiquement un u devant toutes les chaines non ascii ? Surtout qu'il faudra l'enlever au passage à la version 3...
Je viens finalement d'en écrire un, je l'ais mis sur le wiki : http://wikipython.flibuste.net/JouerAvecUnicode#Mise.2BAOAjourdescripts
-- William Dodé - http://flibuste.net Informaticien Indépendant
On 16-08-2008, William Dode wrote:
On 16-08-2008, William Dode wrote:
On 16-08-2008, Méta-MCI wrote:
Re !
A mon avis le plus propre est de tout passer en unicode non ?
Pour les chaînes littérales, je suis complètement d'accord.
Bon, mais du coup, est-ce qu'il existerai pas un script pour mettre
automatiquement un u devant toutes les chaines non ascii ? Surtout qu'il
faudra l'enlever au passage à la version 3...
Je viens finalement d'en écrire un, je l'ais mis sur le wiki :
http://wikipython.flibuste.net/JouerAvecUnicode#Mise.2BAOAjourdescripts
--
William Dodé - http://flibuste.net
Informaticien Indépendant
A mon avis le plus propre est de tout passer en unicode non ?
Pour les chaînes littérales, je suis complètement d'accord.
Bon, mais du coup, est-ce qu'il existerai pas un script pour mettre automatiquement un u devant toutes les chaines non ascii ? Surtout qu'il faudra l'enlever au passage à la version 3...
Je viens finalement d'en écrire un, je l'ais mis sur le wiki : http://wikipython.flibuste.net/JouerAvecUnicode#Mise.2BAOAjourdescripts
-- William Dodé - http://flibuste.net Informaticien Indépendant
Bruno Desthuilliers
William Dode a écrit :
On 16-08-2008, Méta-MCI wrote:
Re !
La question est plus floue.
Je précise...
En utf-8 les caractères accentués prennent 2 octets, du coup si on fait un slice ça foire :
print 'é'[0]
à ce qui est normal puisque
'é'
'xc3xa9'
il faut donc être en unicode
print u'é'[0]
é
u'é'
u'xe9'
J'ai donc l'impression que si on travaille en utf8 il faut également travailler en unicode.
C'est de plus en plus souvent le cas dans les frameworks web : en interne, tout est en unicode, les différents sous-systèmes (templates, accès aux données...) se chargeant de l'encodage/décodage quand nécessaire pour les échanges avec le monde extérieur.
Mais du coup sur un vieux programme il faut se taper toutes les chaines et rajouter un u devant.
Toutes les chaines littérales, oui.
L'autre solution c'est de passer en unicode uniquement quand y a une manipulation de chaine. A mon avis le plus propre est de tout passer en unicode non ?
Dans l'idéal, oui AMHA.
William Dode a écrit :
On 16-08-2008, Méta-MCI wrote:
Re !
La question est plus floue.
Je précise...
En utf-8 les caractères accentués prennent 2 octets, du coup si on fait
un slice ça foire :
print 'é'[0]
Ã
ce qui est normal puisque
'é'
'xc3xa9'
il faut donc être en unicode
print u'é'[0]
é
u'é'
u'xe9'
J'ai donc l'impression que si on travaille en utf8 il faut également
travailler en unicode.
C'est de plus en plus souvent le cas dans les frameworks web : en
interne, tout est en unicode, les différents sous-systèmes (templates,
accès aux données...) se chargeant de l'encodage/décodage quand
nécessaire pour les échanges avec le monde extérieur.
Mais du coup sur un vieux programme il faut se
taper toutes les chaines et rajouter un u devant.
Toutes les chaines littérales, oui.
L'autre solution c'est
de passer en unicode uniquement quand y a une manipulation de chaine.
A mon avis le plus propre est de tout passer en unicode non ?
En utf-8 les caractères accentués prennent 2 octets, du coup si on fait un slice ça foire :
print 'é'[0]
à ce qui est normal puisque
'é'
'xc3xa9'
il faut donc être en unicode
print u'é'[0]
é
u'é'
u'xe9'
J'ai donc l'impression que si on travaille en utf8 il faut également travailler en unicode.
C'est de plus en plus souvent le cas dans les frameworks web : en interne, tout est en unicode, les différents sous-systèmes (templates, accès aux données...) se chargeant de l'encodage/décodage quand nécessaire pour les échanges avec le monde extérieur.
Mais du coup sur un vieux programme il faut se taper toutes les chaines et rajouter un u devant.
Toutes les chaines littérales, oui.
L'autre solution c'est de passer en unicode uniquement quand y a une manipulation de chaine. A mon avis le plus propre est de tout passer en unicode non ?
Dans l'idéal, oui AMHA.
William Dode
On 17-08-2008, William Dode wrote:
On 16-08-2008, William Dode wrote:
On 16-08-2008, William Dode wrote:
On 16-08-2008, Méta-MCI wrote:
Re !
A mon avis le plus propre est de tout passer en unicode non ?
Pour les chaînes littérales, je suis complètement d'accord.
Bon, mais du coup, est-ce qu'il existerai pas un script pour mettre automatiquement un u devant toutes les chaines non ascii ? Surtout qu'il faudra l'enlever au passage à la version 3...
Je viens finalement d'en écrire un, je l'ais mis sur le wiki : http://wikipython.flibuste.net/JouerAvecUnicode#Mise.2BAOAjourdescripts
Je viens de le modifier pour qu'il prenne en compte toutes les chaines, y compris celles sur plusieurs lignes avec ''' ou """
-- William Dodé - http://flibuste.net Informaticien Indépendant
On 17-08-2008, William Dode wrote:
On 16-08-2008, William Dode wrote:
On 16-08-2008, William Dode wrote:
On 16-08-2008, Méta-MCI wrote:
Re !
A mon avis le plus propre est de tout passer en unicode non ?
Pour les chaînes littérales, je suis complètement d'accord.
Bon, mais du coup, est-ce qu'il existerai pas un script pour mettre
automatiquement un u devant toutes les chaines non ascii ? Surtout qu'il
faudra l'enlever au passage à la version 3...
Je viens finalement d'en écrire un, je l'ais mis sur le wiki :
http://wikipython.flibuste.net/JouerAvecUnicode#Mise.2BAOAjourdescripts
Je viens de le modifier pour qu'il prenne en compte toutes les chaines,
y compris celles sur plusieurs lignes avec ''' ou """
--
William Dodé - http://flibuste.net
Informaticien Indépendant
A mon avis le plus propre est de tout passer en unicode non ?
Pour les chaînes littérales, je suis complètement d'accord.
Bon, mais du coup, est-ce qu'il existerai pas un script pour mettre automatiquement un u devant toutes les chaines non ascii ? Surtout qu'il faudra l'enlever au passage à la version 3...
Je viens finalement d'en écrire un, je l'ais mis sur le wiki : http://wikipython.flibuste.net/JouerAvecUnicode#Mise.2BAOAjourdescripts
Je viens de le modifier pour qu'il prenne en compte toutes les chaines, y compris celles sur plusieurs lignes avec ''' ou """
-- William Dodé - http://flibuste.net Informaticien Indépendant
MC
William Dode avait prétendu :
Je viens de le modifier pour qu'il prenne en compte toutes les chaines, y compris celles sur plusieurs lignes avec ''' ou """
Les docstrings aussi ?
-- @-salutations
Michel Claveau
William Dode avait prétendu :
Je viens de le modifier pour qu'il prenne en compte toutes les chaines,
y compris celles sur plusieurs lignes avec ''' ou """
Je viens de le modifier pour qu'il prenne en compte toutes les chaines, y compris celles sur plusieurs lignes avec ''' ou """
Les docstrings aussi ?
Effectivement oui... Par contre ça n'a pas l'air bien génant.
-- William Dodé - http://flibuste.net Informaticien Indépendant
Amaury Forgeot d'Arc
William Dode a écrit :
On 16-08-2008, Méta-MCI wrote:
Re !
A mon avis le plus propre est de tout passer en unicode non ?
Pour les chaînes littérales, je suis complètement d'accord.
Bon, mais du coup, est-ce qu'il existerai pas un script pour mettre automatiquement un u devant toutes les chaines non ascii ? Surtout qu'il faudra l'enlever au passage à la version 3...
ça existe en python 2.6:
>>> from __future__ import unicode_literals >>> 'a' u'a'
Seulement, il faut le mettre en haut de chaque script.
-- Amaury Forgeot d'Arc
William Dode a écrit :
On 16-08-2008, Méta-MCI wrote:
Re !
A mon avis le plus propre est de tout passer en unicode non ?
Pour les chaînes littérales, je suis complètement d'accord.
Bon, mais du coup, est-ce qu'il existerai pas un script pour mettre
automatiquement un u devant toutes les chaines non ascii ? Surtout qu'il
faudra l'enlever au passage à la version 3...
ça existe en python 2.6:
>>> from __future__ import unicode_literals
>>> 'a'
u'a'
Seulement, il faut le mettre en haut de chaque script.
A mon avis le plus propre est de tout passer en unicode non ?
Pour les chaînes littérales, je suis complètement d'accord.
Bon, mais du coup, est-ce qu'il existerai pas un script pour mettre automatiquement un u devant toutes les chaines non ascii ? Surtout qu'il faudra l'enlever au passage à la version 3...
ça existe en python 2.6:
>>> from __future__ import unicode_literals >>> 'a' u'a'
Seulement, il faut le mettre en haut de chaque script.
-- Amaury Forgeot d'Arc
Laurent Pointal
Le Fri, 15 Aug 2008 13:32:49 +0000, William Dode a écrit :
slt,
Petit sondage, est-ce que vous programmez systématiquement en unicode et utf8 aujourd'hui ?
Oui
-- Laurent POINTAL -
Le Fri, 15 Aug 2008 13:32:49 +0000, William Dode a écrit :
slt,
Petit sondage, est-ce que vous programmez systématiquement en unicode et
utf8 aujourd'hui ?
Le Fri, 15 Aug 2008 13:32:49 +0000, William Dode a écrit :
slt,
Petit sondage, est-ce que vous programmez systématiquement en unicode et utf8 aujourd'hui ?
Oui
-- Laurent POINTAL -
William Dode
On 20-10-2008, Laurent Pointal wrote:
Le Fri, 15 Aug 2008 13:32:49 +0000, William Dode a écrit :
slt,
Petit sondage, est-ce que vous programmez systématiquement en unicode et utf8 aujourd'hui ?
Oui
Et bien, ça y est, j'ai migré quasiment toutes mes applications en utf8-unicode ! Mais alors, je préviens ceux qui seraient tentés de le faire, ce n'est pas une mince affaire !
-- William Dodé - http://flibuste.net Informaticien Indépendant
On 20-10-2008, Laurent Pointal wrote:
Le Fri, 15 Aug 2008 13:32:49 +0000, William Dode a écrit :
slt,
Petit sondage, est-ce que vous programmez systématiquement en unicode et
utf8 aujourd'hui ?
Oui
Et bien, ça y est, j'ai migré quasiment toutes mes applications en
utf8-unicode ! Mais alors, je préviens ceux qui seraient tentés de le
faire, ce n'est pas une mince affaire !
--
William Dodé - http://flibuste.net
Informaticien Indépendant
Le Fri, 15 Aug 2008 13:32:49 +0000, William Dode a écrit :
slt,
Petit sondage, est-ce que vous programmez systématiquement en unicode et utf8 aujourd'hui ?
Oui
Et bien, ça y est, j'ai migré quasiment toutes mes applications en utf8-unicode ! Mais alors, je préviens ceux qui seraient tentés de le faire, ce n'est pas une mince affaire !
-- William Dodé - http://flibuste.net Informaticien Indépendant
Le Fri, 15 Aug 2008 13:32:49 +0000, William Dode a écrit :
slt,
Petit sondage, est-ce que vous programmez systématiquement en unicode et utf8 aujourd'hui ?
Oui
Et bien, ça y est, j'ai migré quasiment toutes mes applications en utf8-unicode ! Mais alors, je préviens ceux qui seraient tentés de le faire, ce n'est pas une mince affaire !
Python 3000 ne sera t'il pas unicode par défaut ?
Si, et ce ne sera pas une mince affaire.
-- Amaury
BertrandB a écrit :
William Dode a écrit :
On 20-10-2008, Laurent Pointal wrote:
Le Fri, 15 Aug 2008 13:32:49 +0000, William Dode a écrit :
slt,
Petit sondage, est-ce que vous programmez systématiquement en unicode et
utf8 aujourd'hui ?
Oui
Et bien, ça y est, j'ai migré quasiment toutes mes applications en
utf8-unicode ! Mais alors, je préviens ceux qui seraient tentés de le
faire, ce n'est pas une mince affaire !
Le Fri, 15 Aug 2008 13:32:49 +0000, William Dode a écrit :
slt,
Petit sondage, est-ce que vous programmez systématiquement en unicode et utf8 aujourd'hui ?
Oui
Et bien, ça y est, j'ai migré quasiment toutes mes applications en utf8-unicode ! Mais alors, je préviens ceux qui seraient tentés de le faire, ce n'est pas une mince affaire !