Analyse ligne de commandes

Le
Pierre Maurette
Bonjour,

Je cherche à réutiliser l'existant concernant l'analyse primaire de la
ligne de commandes, en fait le découpage. J'ai une ligne de commande
sous forme de chaîne de caractères:
r'rsync -a "pierre@UBUNTU64-V:/home/pierre maurette/SITES/"'
et je veux en tirer une liste de chaînes. Le problème évidemment se
situe au niveau des arguments contenant des espaces. C'est encore assez
facile de traiter les '"', mais si on ajoute les échappements et
peut-être d'autres subtilités, ça risque de se compliquer. D'où ma
volonté d'utiliser ce qui existe.
Je n'ai pas trouvé dans Python où est fait ce découpage. En fait, je ne
sais pas si c'est fait par Python ou par l'OS. Pour un exécutable
compilé, c'est l'OS.
Pour l'instant, j'utilise une méthode un peu bourri, je lance une
instance de Python avec la ligne de commandes et je récupère sys.argv.
J4ai survolé optparse (que j'utilise) et getopt (que je n'utilise pas)
mais je n'ai rien vu, il semble que ces modules se situent en aval de
l'analyse primaire.
Y a-t-il une fonction qui me ferait ça simplement ? Je me suis résolu à
poser la question parce que j'ai constaté qu'en Python je passais pas
mal de temps à réinventer la roue, alors qu'il existe beaucoup de
ressources que j'ignore, ou pire que j'ai oublié après les avoir
utilisées une fois grâce à Google.

Pour info mon code de test avec la méthode bourrin (le but de ce petit
outil est de gérer une ruche de commandes chiantes à mémoriser et à
saisir):

#! /usr/bin/env python
# -*- coding: utf-8 -*-

import sys, subprocess

commandes = [
[ r'Synchroniser D:/SITES vers @UBUNTU64-V'
, r'rsync -a --delete /cygdrive/d/SITES/
pierre@UBUNTU64-V:/home/pierre/SITES/']
, [ r'Synchroniser D:/SITES vers @UBUNTU64-V'
, r'rsync -a --delete /cygdrive/d/SITES/
"pierre@UBUNTU64-V:/home/pierre maurette/SITES/"']
, [ r'Synchroniser D:/SITES vers @UBUNTU64-V'
, r'rsync -a --delete /cygdrive/d/SITES/
"pierre@UBUNTU64-V:/home/pierre/SITES/"']
]

def getShellCommandResult(command=['ls']):
p = subprocess.Popen(args=command
, stdin=subprocess.PIPE
, stdout=subprocess.PIPE
, stderr=subprocess.STDOUT)
pw = p.wait()
return pw, p.stdout.readlines()


basecmd = 'python -c "import sysfor _ in sys.argv[1:]: print _" '

for num, item in enumerate(commandes):
print '%it%s' % (num, item[0])
pw, result = getShellCommandResult(basecmd + item[1])
for item in result:
print item.strip()

pw, result = getShellCommandResult(commandes[2][1])
if pw != 0:
print '[!!! error %d]' % pw
if len(result) > 0:
print ''.join(result)

--
Pierre Maurette
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Alain Ketterlin
Le #20193611
Pierre Maurette
Je cherche à réutiliser l'existant concernant l'analyse primair e de la
ligne de commandes, en fait le découpage. J'ai une ligne de commande
sous forme de chaîne de caractères:
r'rsync -a ":/home/pierre maurette/SITES/"'
et je veux en tirer une liste de chaînes. Le problème évid emment se
situe au niveau des arguments contenant des espaces. C'est encore
assez facile de traiter les '"', mais si on ajoute les échappements et
peut-être d'autres subtilités, ça risque de se compliquer. D'où ma
volonté d'utiliser ce qui existe.

Je n'ai pas trouvé dans Python où est fait ce découpage. E n fait, je
ne sais pas si c'est fait par Python ou par l'OS. Pour un exécutable
compilé, c'est l'OS.



Pas tout à fait. C'est le shell qui fait le découpage. Le systà ¨me ne
voit que les mots fournis aux variantes de execve().

Pour l'instant, j'utilise une méthode un peu bourri, je lance une
instance de Python avec la ligne de commandes et je récupère sy s.argv.



Ce n'est pas forcément une mauvaise solution. En tout cas elle est
portable.

Y a-t-il une fonction qui me ferait ça simplement ?



En C/POSIX il y a wordexp(). Je ne sais pas si c'est visible en python,
ça ne semble pas faire partie de la lib (mais je n'ai pas beaucoup
cherché).

-- Alain.
Pierre Maurette
Le #20193731
Alain Ketterlin, le 21/09/2009 a écrit :
Pierre Maurette
Je cherche à réutiliser l'existant concernant l'analyse primaire de la
ligne de commandes, en fait le découpage. J'ai une ligne de commande
sous forme de chaîne de caractères:
r'rsync -a ":/home/pierre maurette/SITES/"'
et je veux en tirer une liste de chaînes. Le problème évidemment se
situe au niveau des arguments contenant des espaces. C'est encore
assez facile de traiter les '"', mais si on ajoute les échappements et
peut-être d'autres subtilités, ça risque de se compliquer. D'où ma
volonté d'utiliser ce qui existe.

Je n'ai pas trouvé dans Python où est fait ce découpage. En fait, je
ne sais pas si c'est fait par Python ou par l'OS. Pour un exécutable
compilé, c'est l'OS.



Pas tout à fait. C'est le shell qui fait le découpage. Le système ne
voit que les mots fournis aux variantes de execve().



Oui, en fait en écrivant OS, je pensais au shell. Disons d'une façon
générale le loader, le chargeur, l'interprêteur de commande. Et
maintenant je vois bien que ce n'est pas fondamentalement différent
pour un script Python. C'est l'exécutable python ou python.exe qui
reçoit la première salve dont il retire le premier élément, etc.

Pour l'instant, j'utilise une méthode un peu bourri, je lance une
instance de Python avec la ligne de commandes et je récupère sys.argv.



Ce n'est pas forcément une mauvaise solution. En tout cas elle est
portable.



La portabilité est une contrainte. Je vais donc pour le moment
continuer avec cette méthode en attendant d'autres propositions
éventuelles.

Y a-t-il une fonction qui me ferait ça simplement ?



En C/POSIX il y a wordexp(). Je ne sais pas si c'est visible en python,
ça ne semble pas faire partie de la lib (mais je n'ai pas beaucoup
cherché).



On doit pouvoir prendre le source de wordexp() peut-être plus clair
qu'un document normatif et en découler une fonction Python, mais le jeu
n'en vaut pas la chandelle pour l'instant.

Merci et bonne journée...

--
Pierre Maurette
Alain BARTHE
Le #20194241
Pierre Maurette a écrit :
Bonjour,

Je cherche à réutiliser l'existant concernant l'analyse primaire de la
ligne de commandes, en fait le découpage. J'ai une ligne de commande
sous forme de chaîne de caractères:
r'rsync -a ":/home/pierre maurette/SITES/"'
et je veux en tirer une liste de chaînes. Le problème évidemment se
situe au niveau des arguments contenant des espaces. C'est encore assez
facile de traiter les '"', mais si on ajoute les échappements et
peut-être d'autres subtilités, ça risque de se compliquer. D'où ma
volonté d'utiliser ce qui existe.
Je n'ai pas trouvé dans Python où est fait ce découpage. En fait, je ne
sais pas si c'est fait par Python ou par l'OS. Pour un exécutable
compilé, c'est l'OS.
Pour l'instant, j'utilise une méthode un peu bourri, je lance une
instance de Python avec la ligne de commandes et je récupère sys.argv.
J4ai survolé optparse (que j'utilise) et getopt (que je n'utilise pas)
mais je n'ai rien vu, il semble que ces modules se situent en aval de
l'analyse primaire.
Y a-t-il une fonction qui me ferait ça simplement ? Je me suis résolu à
poser la question parce que j'ai constaté qu'en Python je passais pas
mal de temps à réinventer la roue, alors qu'il existe beaucoup de
ressources que j'ignore, ou pire que j'ai oublié après les avoir
utilisées une fois grâce à Google.

Pour info mon code de test avec la méthode bourrin (le but de ce petit
outil est de gérer une ruche de commandes chiantes à mémoriser et à
saisir):

#! /usr/bin/env python
# -*- coding: utf-8 -*-

import sys, subprocess

commandes = [
[ r'Synchroniser D:/SITES vers @UBUNTU64-V'
, r'rsync -a --delete /cygdrive/d/SITES/
:/home/pierre/SITES/']
, [ r'Synchroniser D:/SITES vers @UBUNTU64-V'
, r'rsync -a --delete /cygdrive/d/SITES/
":/home/pierre maurette/SITES/"']
, [ r'Synchroniser D:/SITES vers @UBUNTU64-V'
, r'rsync -a --delete /cygdrive/d/SITES/
":/home/pierre/SITES/"']
]

def getShellCommandResult(command=['ls']):
p = subprocess.Popen(args=command
, stdin=subprocess.PIPE
, stdout=subprocess.PIPE
, stderr=subprocess.STDOUT)
pw = p.wait()
return pw, p.stdout.readlines()


basecmd = 'python -c "import sysnfor _ in sys.argv[1:]: print _" '

for num, item in enumerate(commandes):
print '%it%s' % (num, item[0])
pw, result = getShellCommandResult(basecmd + item[1])
for item in result:
print item.strip()

pw, result = getShellCommandResult(commandes[2][1])
if pw != 0:
print '[!!! error %d]' % pw
if len(result) > 0:
print ''.join(result)




Il me semble que tu devrais regarder :
- le module getopt pour la décomposition des divers arguments,
- le module urlparse pour décomposer les sous-parties de l'arguments de
rsync décrivant ton url.
Pierre Maurette
Le #20194431
Alain BARTHE, le 21/09/2009 a écrit :

[...]

Il me semble que tu devrais regarder :
- le module getopt pour la décomposition des divers arguments,
- le module urlparse pour décomposer les sous-parties de l'arguments de rsync
décrivant ton url.



Merci. Je suis toujours trop verbeux quand je pose une question, je
n'ai pas été clair. J'ai survolé getopt, il me semble bien que ça vient
en aval du découpage primaire. Je jetterai un oeil à urlparse. Mais
rsync n'est qu'un exemple, ce que je veux c'est à partir d'une chaîne
par exemple copiée-collée depuis une console, obtenir le découpage, le
même que celui que fait le shell, pour renvoyer cette liste dans
subprocessPopen(). D'ailleurs ça fonctionne correctement avec mon
bidule bourrin.
Je pourrais bien entendu envoyer la chaîne complète dans os.system() ou
peut-être subprocess.call(), mais ça ne fait pas ce que je veux. Et il
me semble qu'envoyer une chaîne unique dans subprocess.Popen() ne
fonctionne pas, ou pas toujours. Mais je me trompe peut-être à ce
niveau.

--
Pierre Maurette
Alain BARTHE
Le #20195241
Pierre Maurette a écrit :
Alain BARTHE, le 21/09/2009 a écrit :

[...]

Il me semble que tu devrais regarder :
- le module getopt pour la décomposition des divers arguments,
- le module urlparse pour décomposer les sous-parties de l'arguments
de rsync décrivant ton url.



Merci. Je suis toujours trop verbeux quand je pose une question, je n'ai
pas été clair. J'ai survolé getopt, il me semble bien que ça vient en
aval du découpage primaire. Je jetterai un oeil à urlparse. Mais rsync
n'est qu'un exemple, ce que je veux c'est à partir d'une chaîne par
exemple copiée-collée depuis une console, obtenir le découpage, le même
que celui que fait le shell, pour renvoyer cette liste dans
subprocessPopen(). D'ailleurs ça fonctionne correctement avec mon bidule
bourrin.
Je pourrais bien entendu envoyer la chaîne complète dans os.system() ou
peut-être subprocess.call(), mais ça ne fait pas ce que je veux. Et il
me semble qu'envoyer une chaîne unique dans subprocess.Popen() ne
fonctionne pas, ou pas toujours. Mais je me trompe peut-être à ce niveau.




Désolé, c'est ma fautre : j'avais lu ton premier mail un peu rapidement,
et surtout sans lire l'exemple.

Il m'est arrivé par contre d'utiliser le os.popen() sans trop de
problèmes. Je n'ai pas encore utilisé le module subprocess mais on doit
y retrouver les mêmes fonctionnalités, avec une meilleure portabilité
que os.popen()

Bonne continuation dans tes recherche.
Pierre Maurette
Le #20202551
Je fais un retour final en remerciant Alain et Alain ;-) pour leurs
réponses.
Je vais en rester au code tel qu'il est et qui fonctionne. D'abord, je
me suis égaré, je savais très bien que l'analyse brutale de la ligne de
commandes (c'est à dire chaine -> liste, ou char*[] en fait) est faite
par le shell / OS / loader / etc. Donc il n'y a pas de raison que cette
analyse fasse l'objet d'une fonction de Python. Ensuite les solutions
alternatives:
- Parser moi-même. C'est pas si simple, je ne sais pas s'il y a des
différences entre Posix et Windows, etc. Donc laisser le parsing à l'OS
est une solution raisonnable.
- Utiliser la chaine sans la saucissonner. Ça ne m'arrange pas, ce
n'est pas le choix initial. J'ai besoin de Popen() pour récupérer la
sortie, etc.
- Entrer en données non pas la chaine mais la liste. Ça fonctionne,
mais j'utilise beaucoup la modification directe du code, et je cherche
à diminuer ce genre de contrainte. En fait je veux pouvoir copier -
coller par exemple une commande vers le source ou un .ini

Puisque l'activité sur le groupe est absolument frénétique, je soumets
un autre truc du même genre. Le contexte: c'est dans un fichier
SConstruct pour scons. Le SConstruct est portable, mais ce bout ne
concerne que Windows, par définition. Il s'agit de récupérer
l'environnement issu d'un ?????.bat, qui positionne des variables
d'environnement. Le bout de code qui suit est un peu compact, voire
abscons. C'est pour éviter deux fichiers satellites, un .bat et un .py,
mais ça marche en appelant le .bat qui appelle le .py. Le code:

# -*- coding: utf-8 -*-
import os, pickle, subprocess

batName = r'D:Program Files (x86)Microsoft Visual Studio
9.0VCvcvarsall.bat'
arch = 'x86_amd64'
subprocess.call("cmd /C @call "%s" %s & @call python -c "import os,
pickle; pickle.dump(os.environ, open('_', 'wb'))"" %(batName, arch))
env = pickle.load(open('_', 'rb'))
print env['VSINSTALLDIR'] #test
print env['VCINSTALLDIR'] #test
os.system('del _')

La question - non vitale - est de savoir s'il y a mins tordu, et en
particulier si on peut éviter le fichier temporaire.

Bonne fin de journée.

--
Pierre Maurette
Pierre Maurette
Le #20202541
(supersedes
Je fais un retour final en remerciant Alain et Alain ;-) pour leurs
réponses.
Je vais en rester au code tel qu'il est et qui fonctionne. D'abord, je
me suis égaré, je savais très bien que l'analyse brutale de la ligne de
commandes (c'est à dire chaine -> liste, ou char*[] en fait) est faite
par le shell / OS / loader / etc. Donc il n'y a pas de raison que cette
analyse fasse l'objet d'une fonction de Python. Ensuite les solutions
alternatives:
- Parser moi-même. C'est pas si simple, je ne sais pas s'il y a des
différences entre Posix et Windows, etc. Donc laisser le parsing à l'OS
est une solution raisonnable.
- Utiliser la chaine sans la saucissonner. Ça ne m'arrange pas, ce
n'est pas le choix initial. J'ai besoin de Popen() pour récupérer la
sortie, etc.
- Entrer en données non pas la chaine mais la liste. Ça fonctionne,
mais j'utilise beaucoup la modification directe du code, et je cherche
à diminuer ce genre de contrainte. En fait je veux pouvoir copier -
coller par exemple une commande vers le source ou un .ini

Puisque l'activité sur le groupe est absolument frénétique, je soumets
un autre truc du même genre. Le contexte: c'est dans un fichier
SConstruct pour scons. Le SConstruct est portable, mais ce bout ne
concerne que Windows, par définition. Il s'agit de récupérer
l'environnement issu d'un ?????.bat, qui positionne des variables
d'environnement. Le bout de code qui suit est un peu compact, voire
abscons. C'est pour éviter deux fichiers satellites, un .bat et un .py,
mais ça marche en appelant le .bat qui appelle le .py. Le code:

# -*- coding: utf-8 -*-
import os, pickle, subprocess

batName = r'D:Program Files (x86)Microsoft Visual Studio
9.0VCvcvarsall.bat'
arch = 'x86_amd64'
subprocess.call("cmd /C @call "%s" %s & @call python -c "import os,
pickle; pickle.dump(os.environ, open('_', 'wb'))"" %(batName, arch))
env = pickle.load(open('_', 'rb'))
print env['VSINSTALLDIR'] #test
print env['VCINSTALLDIR'] #test
os.system('del _')

La question - non vitale - est de savoir s'il y a moins tordu, et en
particulier si on peut éviter le fichier temporaire.

Bonne fin de journée.

--
Pierre Maurette
Jogo
Le #20202651
Salut,

Je suis vraiment nouveau en Python, et j'avoue ne pas avoir lu ton
script avec tout l'attention qu'il aurait fallu. Mais pourquoi
n'utilises-tu pas le module shlex et sa fonction split, en standart
depuis la version 2.3 ?

--
Les conflits non résolus se règlent devant le juge, une personne qui
n'est ni juge ni partie.
-+- B in GNU : Parti de là, tu ne peux pas juger. -+-
Pierre Maurette
Le #20202981
Jogo, le 22/09/2009 a écrit :
Salut,

Je suis vraiment nouveau en Python, et j'avoue ne pas avoir lu ton
script avec tout l'attention qu'il aurait fallu. Mais pourquoi
n'utilises-tu pas le module shlex et sa fonction split, en standart
depuis la version 2.3 ?



Fondamentalement, parce que je ne le connaissais pas ;-) Mais je vous
remercie et vous garantis que sous un ou deux jours j'aurai un petit
test_shlex.py sous mon dossier /Thematique/ pour tester ce truc qui me
semble intéressant.
A+

--
Pierre Maurette
chris
Le #20203511
Pierre Maurette a écrit :
Jogo, le 22/09/2009 a écrit :
Salut,

Je suis vraiment nouveau en Python, et j'avoue ne pas avoir lu ton
script avec tout l'attention qu'il aurait fallu. Mais pourquoi
n'utilises-tu pas le module shlex et sa fonction split, en standart
depuis la version 2.3 ?



Fondamentalement, parce que je ne le connaissais pas ;-) Mais je vous
remercie et vous garantis que sous un ou deux jours j'aurai un petit
test_shlex.py sous mon dossier /Thematique/ pour tester ce truc qui me
semble intéressant.
A+




oui il me semble que shlex est bien car il tiens compte des pieges avec
les guillemets

A+
chris
Publicité
Poster une réponse
Anonyme