Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Les scripts perl

5 réponses
Avatar
ritzy
Bonjour tout le monde,

En ce moment =C3=A9tudiant en traductique, j'ai commenc=C3=A9 =C3=A0 appren=
dre les
langages de perl et des scripts, mais je suis pas tr=C3=A8s tr=C3=A8s dou=
=C3=A9 pour
le langage de programmation et qui fait que j'ai du mal =C3=A0 comprendre
quelques exercices. Auriez-vous la gentillesse de me trouver des
solutions par rapport =C3=A0 mes questions?

J'ai des questions et des fichiers mais y a til une possibilt=C3=A9 de
partager les fichiers de tarvail sur ce groupe? si oui par quel biais?

Si l'un d'entre vous voulez bien me donner une adresse m=C3=A9l je pourrais
=C3=A0 la rigeur vous envoyer les fichiers par mel.

En vous remerciant d'avance,

Veuillez trouver en bas le sujet des exercices:

Fichiers de travai l :
Tous les fichiers dont j'ai besoin sont dans le r=C3=A9pertoire
Devoir_fichiers_travail
Sujet :
l'exercice est compos=C3=A9 de 3 parties : (A) 2 scripts =C3=A0 =C3=A9crire=
, (B) un
script =C3=A0
interpr=C3=A9ter/corriger et (C) un algorithme =C3=A0 =C3=A9crire.
(A) Faire un script Perl pour chaque question ci-dessous :
NB ! N'oubliez pas de commenter vos scripts et les rendre aussi
lisibles que possible (par
espacement, par indentation, par regroupement en blocs, etc.) !
1) (5pts) Prendre en entr=C3=A9e le fichier ./wget_log.txt qui est le
fichier log de l'outil
Wget. Extraire pour chaque fichier HTML (reconnu comme tel par le
serveur et
marqu=C3=A9 par l'en-t=C3=AAte text/html) les informations suivantes :
1. url du fichier t=C3=A9l=C3=A9charg=C3=A9
2. la date compl=C3=A8te du t=C3=A9l=C3=A9chargement
3. le chemin relatif pour indiquer l'endroit o=C3=B9 le fichier a =C3=A9t=
=C3=A9
enregistr=C3=A9
Stocker toutes les informations dans le fichier metainfos.txt avec le
format
suivant (une ligne =3D les informations d'un fichier) :
url1 TAB chemin1 TAB date1
url2 TAB chemin2 TAB date2
2) (6 pts) Prendre en entr=C3=A9e le fichier ./metainfos_corpus.txt dans
lequel on trouve
diff=C3=A9rentes informations sur les fichiers constituant un petit corpus.
Format :
url1 TAB fichier_html1 TAB date_t=C3=A9l=C3=A9chargement1 TAB fichier_txt1
url2 TAB fichier_html2 TAB date_t=C3=A9l=C3=A9chargement2 TAB fichier_txt2
...
R=C3=A9cup=C3=A9rer le chemin des fichiers texte et appliquer pour chaque
fichier texte le
traitement suivant :
1. Diviser le texte en phrases : une phrase sur une ligne
2. Supprimer les lignes vides (ou quasi-vides)
3. Supprimer les marques de paragraphes (=C2=A7) qui n'introduisent en
r=C3=A9alit=C3=A9 aucun
paragraphe. (Donc, les =C2=A7 suivis d'une ligne (quasi-)vide.)
4. Remplacer les majuscules par les minuscules pr=C3=A9c=C3=A9d=C3=A9s par =
un
ast=C3=A9risque sauf
dans cas o=C3=B9 les majuscules sont susceptibles de faire partie d'un
sigle (Mais =E2=86=92
*mais ; ANR =E2=86=92 ANR)
5. V=C3=A9rifier que le texte ne contienne pas des balises (le cas =C3=A9ch=
=C3=A9ant,
les remplacer
par des entit=C3=A9s html : "<" =E2=86=92 "&lt;", ">" =E2=86=92 "&gt;")
6. Encoder le fichier en cp1252 (pour pouvoir =C3=AAtre lu par Lexico3)
Concatener les fichiers dans un seul fichier fichier_corpus.txt en
indiquant les
d=C3=A9buts des fichiers avec une balise du type Lexico3 :
<texte=3D001>
ici, le texte du premier fichier
<texte=3D002>
ici, le texte du deuxi=C3=A8me fichier
...


(B) (5 pts) Lire le script ./script1.pl et faire le suivant :
1. Corriger le probl=C3=A8me du codage dans les fichiers de sortie. Plus
g=C3=A9n=C3=A9ralement,
indiquer les jeux de codage d'une mani=C3=A8re explicite dans le script.
2. Compl=C3=A9ter le script de fa=C3=A7on =C3=A0 obtenir un fichier xml o=
=C3=B9 les unit=C3=A9s
lexicales
viennent dans l'ordre alphab=C3=A9tique et non dans l'ordre de fr=C3=A9quen=
ce.
3. D=C3=A9crire ce que le script fait globalement (entr=C3=A9e + sortie)
4. Commenter chaque instruction du script pour indiquer sa fonction.
Exemple :
# enlever le caract=C3=A8re retour =C3=A0 la ligne
chomp($ligne);
#Test : si la $ligne contient une chiffre
if( $ligne=3D~/[09]/){
=E2=80=A6
(C) (4 pts) =C3=89crire un algorithme en langage semi-naturel pour un
programme qui :
1. prend en entr=C3=A9e un chemin vers un r=C3=A9pertoire qui contient des
fichiers html,
2. extrait de chaque fichier les mots-cl=C3=A9s, le titre et le texte, et
3. stocke les informations extraites dans un fichier tabulaire (1
ligne =3D les
informations sur 1 fichier)
NB ! Pour les structures de contr=C3=B4le, utiliser les conventions
d'=C3=A9criture donn=C3=A9es
dans les slides du cours : SI =E2=80=A6 FIN SI, SI =E2=80=A6 SINON SI =E2=
=80=A6 FIN SI, POUR =E2=80=A6
de =E2=80=A6 FIN
POUR, TANT QUE =E2=80=A6 FIN TANT QUE, etc.

5 réponses

Avatar
Olivier Miakinen
Bonjour,

Le 25/01/2010 12:23, ritzy a écrit :

En ce moment étudiant en traductique,



Je ne connaissais pas ce terme. Le sujet semble intéressant en tout
cas : <http://www.unige.ch/eti/courstim/traductique/>.

j'ai commencé à apprendre les
langages de perl et des scripts, mais je suis pas très très doué pour
le langage de programmation et qui fait que j'ai du mal à comprendre
quelques exercices. Auriez-vous la gentillesse de me trouver des
solutions par rapport à mes questions?



Les forums usenet ne sont pas faits pour donner les réponses aux
exercices des élèves, quel qu'en soit le sujet. Mais si tu as des
questions précises n'hésite pas à venir les poser.

En plus, moi qui ne connais pas encore le langage perl, tes exercices
m'intéressent pour m'y mettre.

J'ai des questions et des fichiers mais y a til une possibilté de
partager les fichiers de tarvail sur ce groupe? si oui par quel biais?



<http://cjoint.com/>

Si l'un d'entre vous voulez bien me donner une adresse mél



Beurk !

<cit. http://www.langue-fr.net/spip.php?article139>
Journal officiel du 20/06/2003
...
Note : « Mél. » ne doit pas être employé comme substantif.
</cit.>

je pourrais
à la rigueur vous envoyer les fichiers par mel.



Ceci aussi est assez contraire à l'esprit d'usenet. Note que s'il y en a
qui souhaitent continuer en privé ils peuvent toujours te répondre à ta
propre adresse de courriel.

Cordialement,
--
Olivier Miakinen
Avatar
Paul Gaborit
À (at) Mon, 25 Jan 2010 13:01:32 +0100,
Olivier Miakinen <om+ écrivait (wrote):

Les forums usenet ne sont pas faits pour donner les réponses aux
exercices des élèves, quel qu'en soit le sujet. Mais si tu as des
questions précises n'hésite pas à venir les poser.



Je confirme : je pense pouvoir répondre à toutes les questions posées
dans ces exercices. Mais ce n'est pas moi qui doit apprendre Perl. Je
n'ai donc aucune envie de perdre du temps à faire ces exercices.

Par contre, si vous posez des questions précises concernant un script
Perl ou une difficulté que vous rencontrez avec ce langage, je suis
prêt (ainsi que d'autres) à prendre du temps pour vous répondre et
vous aider.

En plus, moi qui ne connais pas encore le langage perl, tes exercices
m'intéressent pour m'y mettre.



;-)

J'ai des questions et des fichiers mais y a til une possibilté de
partager les fichiers de tarvail sur ce groupe? si oui par quel biais?





Pour les scripts (sauf si ils sont très longs), il suffit de
copier/coller le code dans le message.

Pour les fichiers de données, un court extrait suffit généralement à
comprendre la problématique.

--
Paul Gaborit - <http://perso.mines-albi.fr/~gaborit/>
Perl en français - <http://perl.mines-albi.fr/>
Avatar
ritzy
Bonjour
Merci beaucoup poiur vos réponses/réactions...
en ce moment je travaille sur ces exercices demandés...puis-je vous
envoyer lorsque j'aurais terminé quelques choses?
Je comprends tout à fait que les étudiants doivent se lancer et de
faire face à ces difficultés mais honnetement je suis pas du tout
intéressé par perl...pourtant je le fais....!!!

En vous remerciant encore,
cordialement,
Ritzy
Avatar
Paul Gaborit
À (at) Fri, 29 Jan 2010 00:35:13 -0800 (PST),
ritzy écrivait (wrote):

Merci beaucoup poiur vos réponses/réactions...
en ce moment je travaille sur ces exercices demandés...puis-je vous
envoyer lorsque j'aurais terminé quelques choses?



Envoyer ? non. Poster ici ? oui. Avec des questions précises indiquant
les problèmes rencontrés...

Je comprends tout à fait que les étudiants doivent se lancer et de
faire face à ces difficultés mais honnetement je suis pas du tout
intéressé par perl...pourtant je le fais....!!!



Honnêtement, vos états d'âmes concernant Perl ne m'intéresse
absolument pas. Ceci étant, si vous demandez ici de l'assistance
concernant Perl et si je peux vous aider, je le ferai !!!

;-)

--
Paul Gaborit - <http://perso.mines-albi.fr/~gaborit/>
Perl en français - <http://perl.mines-albi.fr/>
Avatar
markus
ritzy a écrit :

Je comprends tout à fait que les étudiants doivent se lancer et de
faire face à ces difficultés mais honnetement je suis pas du tout
intéressé par perl.



tu me rapelles la maxime favorite d'un directeur d'une usine ou j'ai
travaillé: "Monsieur, il n'y a pas de travail interessant, il n'y a que
des travaux auquels on s'interesse"