Les scripts perl

Le
ritzy
Bonjour tout le monde,

En ce moment étudiant en traductique, j'ai commencé à appren=
dre les
langages de perl et des scripts, mais je suis pas très très dou=
é pour
le langage de programmation et qui fait que j'ai du mal à comprendre
quelques exercices. Auriez-vous la gentillesse de me trouver des
solutions par rapport à mes questions?

J'ai des questions et des fichiers mais y a til une possibilté de
partager les fichiers de tarvail sur ce groupe? si oui par quel biais?

Si l'un d'entre vous voulez bien me donner une adresse mél je pourrais
à la rigeur vous envoyer les fichiers par mel.

En vous remerciant d'avance,

Veuillez trouver en bas le sujet des exercices:

Fichiers de travai l :
Tous les fichiers dont j'ai besoin sont dans le répertoire
Devoir_fichiers_travail
Sujet :
l'exercice est composé de 3 parties : (A) 2 scripts à écrire=
, (B) un
script à
interpréter/corriger et (C) un algorithme à écrire.
(A) Faire un script Perl pour chaque question ci-dessous :
NB ! N'oubliez pas de commenter vos scripts et les rendre aussi
lisibles que possible (par
espacement, par indentation, par regroupement en blocs, etc.) !
1) (5pts) Prendre en entrée le fichier ./wget_log.txt qui est le
fichier log de l'outil
Wget. Extraire pour chaque fichier HTML (reconnu comme tel par le
serveur et
marqué par l'en-tête text/html) les informations suivantes :
1. url du fichier téléchargé
2. la date complète du téléchargement
3. le chemin relatif pour indiquer l'endroit où le fichier a ét=
é
enregistré
Stocker toutes les informations dans le fichier metainfos.txt avec le
format
suivant (une ligne = les informations d'un fichier) :
url1 TAB chemin1 TAB date1
url2 TAB chemin2 TAB date2
2) (6 pts) Prendre en entrée le fichier ./metainfos_corpus.txt dans
lequel on trouve
différentes informations sur les fichiers constituant un petit corpus.
Format :
url1 TAB fichier_html1 TAB date_téléchargement1 TAB fichier_txt1
url2 TAB fichier_html2 TAB date_téléchargement2 TAB fichier_txt2

Récupérer le chemin des fichiers texte et appliquer pour chaque
fichier texte le
traitement suivant :
1. Diviser le texte en phrases : une phrase sur une ligne
2. Supprimer les lignes vides (ou quasi-vides)
3. Supprimer les marques de paragraphes (§) qui n'introduisent en
réalité aucun
paragraphe. (Donc, les § suivis d'une ligne (quasi-)vide.)
4. Remplacer les majuscules par les minuscules précédés par =
un
astérisque sauf
dans cas où les majuscules sont susceptibles de faire partie d'un
sigle (Mais →
*mais ; ANR → ANR)
5. Vérifier que le texte ne contienne pas des balises (le cas éch=
éant,
les remplacer
par des entités html : "<" → "&lt;", ">" → "&gt;")
6. Encoder le fichier en cp1252 (pour pouvoir être lu par Lexico3)
Concatener les fichiers dans un seul fichier fichier_corpus.txt en
indiquant les
débuts des fichiers avec une balise du type Lexico3 :
<texte=001>
ici, le texte du premier fichier
<texte=002>
ici, le texte du deuxième fichier



(B) (5 pts) Lire le script ./script1.pl et faire le suivant :
1. Corriger le problème du codage dans les fichiers de sortie. Plus
généralement,
indiquer les jeux de codage d'une manière explicite dans le script.
2. Compléter le script de façon à obtenir un fichier xml o=
ù les unités
lexicales
viennent dans l'ordre alphabétique et non dans l'ordre de fréquen=
ce.
3. Décrire ce que le script fait globalement (entrée + sortie)
4. Commenter chaque instruction du script pour indiquer sa fonction.
Exemple :
# enlever le caractère retour à la ligne
chomp($ligne);
#Test : si la $ligne contient une chiffre
if( $ligne=~/[09]/){
…
(C) (4 pts) Écrire un algorithme en langage semi-naturel pour un
programme qui :
1. prend en entrée un chemin vers un répertoire qui contient des
fichiers html,
2. extrait de chaque fichier les mots-clés, le titre et le texte, et
3. stocke les informations extraites dans un fichier tabulaire (1
ligne = les
informations sur 1 fichier)
NB ! Pour les structures de contrôle, utiliser les conventions
d'écriture données
dans les slides du cours : SI … FIN SI, SI … SINON SI â=
€¦ FIN SI, POUR …
de … FIN
POUR, TANT QUE … FIN TANT QUE, etc.
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Olivier Miakinen
Le #21044861
Bonjour,

Le 25/01/2010 12:23, ritzy a écrit :

En ce moment étudiant en traductique,



Je ne connaissais pas ce terme. Le sujet semble intéressant en tout
cas :
j'ai commencé à apprendre les
langages de perl et des scripts, mais je suis pas très très doué pour
le langage de programmation et qui fait que j'ai du mal à comprendre
quelques exercices. Auriez-vous la gentillesse de me trouver des
solutions par rapport à mes questions?



Les forums usenet ne sont pas faits pour donner les réponses aux
exercices des élèves, quel qu'en soit le sujet. Mais si tu as des
questions précises n'hésite pas à venir les poser.

En plus, moi qui ne connais pas encore le langage perl, tes exercices
m'intéressent pour m'y mettre.

J'ai des questions et des fichiers mais y a til une possibilté de
partager les fichiers de tarvail sur ce groupe? si oui par quel biais?




Si l'un d'entre vous voulez bien me donner une adresse mél



Beurk !

Journal officiel du 20/06/2003
...
Note : « Mél. » ne doit pas être employé comme substantif.

je pourrais
à la rigueur vous envoyer les fichiers par mel.



Ceci aussi est assez contraire à l'esprit d'usenet. Note que s'il y en a
qui souhaitent continuer en privé ils peuvent toujours te répondre à ta
propre adresse de courriel.

Cordialement,
--
Olivier Miakinen
Paul Gaborit
Le #21047241
À (at) Mon, 25 Jan 2010 13:01:32 +0100,
Olivier Miakinen
Les forums usenet ne sont pas faits pour donner les réponses aux
exercices des élèves, quel qu'en soit le sujet. Mais si tu as des
questions précises n'hésite pas à venir les poser.



Je confirme : je pense pouvoir répondre à toutes les questions posées
dans ces exercices. Mais ce n'est pas moi qui doit apprendre Perl. Je
n'ai donc aucune envie de perdre du temps à faire ces exercices.

Par contre, si vous posez des questions précises concernant un script
Perl ou une difficulté que vous rencontrez avec ce langage, je suis
prêt (ainsi que d'autres) à prendre du temps pour vous répondre et
vous aider.

En plus, moi qui ne connais pas encore le langage perl, tes exercices
m'intéressent pour m'y mettre.



;-)

J'ai des questions et des fichiers mais y a til une possibilté de
partager les fichiers de tarvail sur ce groupe? si oui par quel biais?





Pour les scripts (sauf si ils sont très longs), il suffit de
copier/coller le code dans le message.

Pour les fichiers de données, un court extrait suffit généralement à
comprendre la problématique.

--
Paul Gaborit - Perl en français -
ritzy
Le #21079501
Bonjour
Merci beaucoup poiur vos réponses/réactions...
en ce moment je travaille sur ces exercices demandés...puis-je vous
envoyer lorsque j'aurais terminé quelques choses?
Je comprends tout à fait que les étudiants doivent se lancer et de
faire face à ces difficultés mais honnetement je suis pas du tout
intéressé par perl...pourtant je le fais....!!!

En vous remerciant encore,
cordialement,
Ritzy
Paul Gaborit
Le #21081001
À (at) Fri, 29 Jan 2010 00:35:13 -0800 (PST),
ritzy
Merci beaucoup poiur vos réponses/réactions...
en ce moment je travaille sur ces exercices demandés...puis-je vous
envoyer lorsque j'aurais terminé quelques choses?



Envoyer ? non. Poster ici ? oui. Avec des questions précises indiquant
les problèmes rencontrés...

Je comprends tout à fait que les étudiants doivent se lancer et de
faire face à ces difficultés mais honnetement je suis pas du tout
intéressé par perl...pourtant je le fais....!!!



Honnêtement, vos états d'âmes concernant Perl ne m'intéresse
absolument pas. Ceci étant, si vous demandez ici de l'assistance
concernant Perl et si je peux vous aider, je le ferai !!!

;-)

--
Paul Gaborit - Perl en français -
markus
Le #21260821
ritzy a écrit :

Je comprends tout à fait que les étudiants doivent se lancer et de
faire face à ces difficultés mais honnetement je suis pas du tout
intéressé par perl.



tu me rapelles la maxime favorite d'un directeur d'une usine ou j'ai
travaillé: "Monsieur, il n'y a pas de travail interessant, il n'y a que
des travaux auquels on s'interesse"
Publicité
Poster une réponse
Anonyme