Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

recuperer adresses emails a partir d une parge html

3 réponses
Avatar
laj73fr
Bonjour

je cherche un moyen sous linux de recuperer toutes les adresses emails
contenues dans une page html puis de transferer ces adresses dans un
fichier txt avec comme separation entre les adresses un point virgule

existe t il des commandes bash ou des softs pour cela ?

merci par avance

3 réponses

Avatar
thomas.baruchel
je cherche un moyen sous linux de recuperer toutes les adresses emails
contenues dans une page html puis de transferer ces adresses dans un
fichier txt avec comme separation entre les adresses un point virgule

existe t il des commandes bash ou des softs pour cela ?


He, hé, pour envoyer du spam ?

Le plus simple est de très loin l'emploi d'une expression régulière;
utilise 'sed' pour faire l'opération. La commande

sed -e '/[^ <]*@[^ >]*/!d' myfile

est un bon point de départ.

--
« nous devons agir comme si la chose qui peut-être ne sera pas devait
être » (Kant, Métaphysique des moeurs, doctrine du droit, II conclusion)

Thomas Baruchel

Avatar
Stephane Chazelas
2003/11/11, 19:28(-08), nico:
je cherche un moyen sous linux de recuperer toutes les adresses emails
contenues dans une page html puis de transferer ces adresses dans un
fichier txt avec comme separation entre les adresses un point virgule

existe t il des commandes bash ou des softs pour cela ?


tr -cs '_0-9a-zA-Z.@+-' '[12*]' < fichier.html
| grep @ | paste '-sd;' - > fichier.text

Attention, ça te renvoie tout ce qui ressemble à une adresse
mail. Un Message-ID ressemble fortement à une adresse mail par
exemple.

--
Stéphane ["Stephane.Chazelas" arobase "free.fr"]

Avatar
manu
Stephane Chazelas wrote:

Attention, ça te renvoie tout ce qui ressemble à une adresse
mail. Un Message-ID ressemble fortement à une adresse mail par
exemple.


Justement, les serveurs de messagerie refusent souvent du mail envoyé à
des message-Id...

--
Emmanuel Dreyfus
Publicité subliminale: achetez ce livre!
http://www.eyrolles.com/php.informatique/Ouvrages/9782212112443.php3