J'ai un problème avec les regexp.
Mon but est de chercher à extraire les adresses email (mais ça peut être
autre chose de bien structuré) d'un fichier texte quelconque. Un exemple
ici, mais que j'ai du mal à comprendre:
http://aspn.activestate.com/ASPN/Cookbook/Python/Recipe/138889
Je ne comprend pas comment convertir "en Français" ceci:
[...]
mailsrch = re.compile(r'[\w\-][\w\-\.]+@[\w\-][\w\-\.]+[a-zA-Z]{1,4}')
[...]
Quelqu'un veut bien m'aider? Spécialement:
- Pourquoi [\w\-][\w\-\.]?
J'ai lu un fois ceci avant de poster:
http://www.amk.ca/python/howto/regex/
--
Telephone portable "intelligent" (SmartPhone) GSM, GPRS,...
Il est sous Linux, ne coute pas trop cher,...
http://www.it2l.com/product_info.php?cPath=91&products_id=456
On Sun, 18 Dec 2005 23:08:50 +0100, Sébastien Kirche wrote:
Donc effectivement pour extraire toute les adresses qui seraient présentes dans un texte il ne faut pas ^ ni $.
Ok, ok... bon. Merci à tous. J'avais compris "^" et "$" comme "début de chaine" et "fin de chaine", mais ne fait c'est "début de ligne" et "fin de ligne". Je comprends mieux.
-- Telephone portable "intelligent" (SmartPhone) GSM, GPRS,... Il est sous Linux, ne coute pas trop cher,... http://www.it2l.com/product_info.php?cPath&products_idE6
On Sun, 18 Dec 2005 23:08:50 +0100, Sébastien Kirche wrote:
Donc effectivement pour extraire toute les adresses qui seraient
présentes dans un texte il ne faut pas ^ ni $.
Ok, ok... bon.
Merci à tous.
J'avais compris "^" et "$" comme "début de chaine" et "fin de chaine",
mais ne fait c'est "début de ligne" et "fin de ligne". Je comprends mieux.
--
Telephone portable "intelligent" (SmartPhone) GSM, GPRS,...
Il est sous Linux, ne coute pas trop cher,...
http://www.it2l.com/product_info.php?cPath&products_idE6
On Sun, 18 Dec 2005 23:08:50 +0100, Sébastien Kirche wrote:
Donc effectivement pour extraire toute les adresses qui seraient présentes dans un texte il ne faut pas ^ ni $.
Ok, ok... bon. Merci à tous. J'avais compris "^" et "$" comme "début de chaine" et "fin de chaine", mais ne fait c'est "début de ligne" et "fin de ligne". Je comprends mieux.
-- Telephone portable "intelligent" (SmartPhone) GSM, GPRS,... Il est sous Linux, ne coute pas trop cher,... http://www.it2l.com/product_info.php?cPath&products_idE6