OVH Cloud OVH Cloud

[HS]

28 réponses
Avatar
_Dine & Clau_
Bonjour,

A la sortie d'une copie de texte de provenance américaine, je me
retrouve - après traduction de Google - en présence de fichiers
textes avec mélange de langues.

Les lignes impaires sont en langue étrangère
Les lignes paires sont en langue française.

Comment puis-je le plus_simplement_du_monde extraire les lignes
paires pour les concaténer dans un nouveau fichier au même nom que
l'ancien en ajoutant le suffixe FR.txt au nom du fichier?

avec quel éditeur ? quel script ? quel bat ? (biffer la mention
inutile) ;+)

je traduis sous "dos" matheux ;+)

----------------------------
move ligne 2n+1 newfileFR.txt
save newfileFR.txt
save firstfile.txt
----------------------------

Merci d'avance pour votre réponse
__
CB
C&C Week-end à Brubbelghem

8 réponses

1 2 3
Avatar
mdnews
On 03 Sep 2009 15:23:54 GMT, "_Dine & Clau_" <_Dine&
wrote:


Les données que j'ai dites ne sont pas exactes. Le txt provenant de
toute traduction google reprend la phrase d'origine suivie de la
traduction française.

Il faudrait au préalable ajouter dans le bat l'endroit de la césure à
pratiquer. Pas facile à comprendre: ligne ? paragraphe ?

Je prend comme exemple la traduction française de l'introduction de
gawk.

http://translate.google.com/translate?hl=fr&sl=en&u=http://gnuwin32.s
ourceforge.net/packages/gawk.htm&ei=QnqfSvq1FoSL-
QaV7N3zDw&sa=X&oi=translate&resnum=4&ct=result&prev=/search%3Fq%3DAWK
.exe%2Bwindows%26hl%3Dfr%26rls%3Dcom.microsoft:fr-be:IE-
SearchBox%26rlz%3D1I7GZAZ_fr



Peux-tu revoir la situation ?




J'ai fais la même constattion que Pierre: Un copié/collé depuis Opera
donne le texte en Français seul, mais le même copié/collé depuis IE ou
FF donne les deux textes imbriqués. Donc, à moins d'utiliser Opera (ce
qui ne pose pas de problème), il faut bidouiller.

Le problème pour séparer les deux textes est qu'il n'y a aucun
séparateur entre les deux versions. Si on regarde en supprimant le
saut de ligne automatique des éditeurs de texte ou si on regarde en
héxadécimal.

Si tu souhaites le faire depuis FF, tu peux le faire en copiant
uniquement la source du bloc: un clic droit sur la sélection, puis
"Code source de la sélection" puis copier/coller. Ca donne un truc de
ce style:

Plusieurs types de missions surviennent à plusieurs reprises lorsque
vous travaillez avec des fichiers texte.</span> <span style=""
onmouseover="_tipon(this)" onmouseout="_tipoff()"><span
class="google-src-text" style="direction: ltr; text-align: left;">You
might want to extract certain lines and discard the rest.</span>

Avec cela, on a donc des séparateurs avec lesquels on peut jouer.
Avatar
_Dine & Clau_
mdnews écrivit dans
news::

On 03 Sep 2009 15:23:54 GMT, "_Dine & Clau_"
<_Dine& wrote:


---------------------------------------------------
VAR /
LE= Langue étrangère (english, sl, de, nl, pl etc ...)
FR= langue française
---------------------------------------------------

Les données que j'ai dites ne sont pas exactes. Le txt provenant
de toute traduction google reprend la phrase d'origine suivie de
la traduction française.




Ce qui ressemble à un "rommelbak" du propriétaire programmeur chez
Google Translate.

Il faudrait au préalable ajouter dans le bat l'endroit de la
césure à pratiquer. Pas facile à comprendre: ligne ? paragraphe





Je prend comme exemple la traduction française de l'introduction
de gawk.





Donc, à moins
d'utiliser Opera (ce qui ne pose pas de problème), il faut
bidouiller.


Je ne suis absolument pas contre Opéra, mais le fait d'avoir
plusieurs navigateurs sur une babasse.

A partir d'une application supérieure autre qu'un navigateur (éditeur
html - OE - fichier txt) et quand on demande "en ligne" :

EN Which brouwser ?
EN defautlt brouwser ?

Or la dernière fois le système lance soit le navigateur désigné par
défaut ou le dernier utilisé (EN - if no default browser). Pas de
chance c'est le troisième que je voulais lancer ! ;-(((

On voit de suite que cette solution n'est pas la bonne. Nervouze
braquedoune garantie.

Je préfère rester avec UN navigateur par babasse et dans mon cas
c'est IE7 (pcq'il vient avec l'OS - tout simplement ;+)).

Par contre sur une autre babasse il m'intéresserait d'avoir un
"Opéra" et de ne *jamais* travailler avec IE 7 (aucun raccourci sur
le bureau) sauf pour les mises-à-jour microsoft.

Le problème pour séparer les deux textes est qu'il n'y a aucun
séparateur entre les deux versions.



Voilà et merci pour ses précisions.

La preuve de l'optique "propriétaire" du programmeur html de chez
Google translate : la traduction peut être vue lue mais doit rester
inutilisable.

[Snip copié-collé de opéra]

Avec cela, on a donc des séparateurs avec lesquels on peut
jouer.


Après téléchargement et installation et réglage d'opéra !

Toujours la même chose : "Pourquoi faire simple, quand on peut faire
compiqué ?"

Voilà pour les tenants et aboutissants. Je voudrais dans un esprit de
partage (non propriétaire) pouvoir m'en tirer avec gawk qui me semble
un excellent dispositif pour travailler sur une base win32. Il est de
plus applicable dans tout fichier txt.

Pour revenir à nos moutons, il faut shifter sur mon premier jet.

Raisons : il est finalement très intéressant de conserver le txt des
deux langues dans deux fichiers individualisés séparés.

Partir de la disposition LE ligne impaire et FR ligne paire me semble
une bonne pratique. La séparation se fait manuellement avec voltige
de la souris et touche deux fois [enter] lors de la première lecture.

Je dispose de plein de fichiers d'aide et de tutoriaux configurés
ainsi. Ce qui me manque :
move "lign pair" newfileFR.txt
save oldfile
save newfileFR.txt

Le copié-collé des lignes paires devenait fatiguant à la fin.

La première lecture et la séparation des langues en paragraphe est
encore assez facile et plaisante (on découvre ...) [J'avais même
oublié que je le faisais et n'en parlais pas dans ma première
internvention]

Agicolement vôtre.

A plus
__
CB
C&C
-------------------------------------
"La connaissance s'accroît quand on la partage" - JCB
Avatar
_Dine & Clau_
A Midget et à Pierre,
Re-bonjour

Répertoires :
c:test
c:testin
c:testout

J'ai donc dans mon awk.bat :

gawk "{if (NR/2 == int(NR/2)) { print $i } }" IN.txt > OUT.txt
copy out.txt c:testout*FR.txt
copy in.txt c:testout*LE.txt

Ma console de cmd XP donne ceci :
C:test>awk
C:test>gawk "{if (NR/2 == int(NR/2)) { print $i } }" IN.txt
1>OUT.txt
C:test>copy out.txt c:testout*FR.*
1 file(s) copied.
C:test>copy in.txt c:testout*LE.*
1 file(s) copied.

Directory of C:testout
04/09/2009 14:41 1.932 in.txtLE.txt
04/09/2009 15:45 1.090 OUT.txtFR.txt
2 File(s) 3.022 bytes

C:testout>cedt in.txtLE.txt
C:testout>"C:Crimson Editorcedt.exe" in.txtLE.txt
C:testout>cedt out.txtFR.txt
C:testout>"C:Crimson Editorcedt.exe" out.txtFR.txt
C:testout>

Le fichier IN est bien traité et awk extrait le FR dans le out. Bon

Mais, l' enregistrement dans la langue d'origine seulement l'anglais
reprend tout le txt du fichier IN car awk "print" ou copie
sans effacement des lignes fançaises.

Egalement, le nom des fichiers n'ont pas la structure unique des
"NOM.ext"

Me trompé-je quelque part ?
__
CB
C&C
Avatar
_Dine & Clau_
Pierre Maurette écrivit dans
news::

Google Chrome



Pardon ?
As-tu lu ??
http://fr.wikipedia.org/wiki/Google_Chrome

[cit début]
Google Chrome 3
Collecte d'informations personnelles

L'autorité allemande de sûreté des techniques d'information (BSI) a
mis en garde les consommateurs à propos de ce navigateur, en
recommandant son usage dans des cas limités : « Google Chrome ne doit
pas être employé pour un usage d'ordre général », a affirmé un porte-
parole de l'autorité fédérale, Matthias Gärtner, dans le quotidien
Berliner Zeitung. M. Gärtner a également déclaré : « Pour des raisons
de sécurité technique, l'accumulation de données par un fournisseur
pose problème »[16].

Lors de l'installation, Google Chrome donne à l'exécutable
Googleupdate.exe un droit d'exécution silencieuse avec élévation de
privilèges dans Internet Explorer. Googleupdate.exe a ainsi le droit
de passer outre les niveaux de protection définis dans Internet
Explorer et de mettre le mode protégé à Medium lorsque qu'il le
décide. Ceci permet l'envoi à Google d'informations sur les
utilisateurs[17].

Le navigateur a déjà été surnommé Big Browser, jeu de mot avec Big
Brother (« browser » désigne un navigateur web en anglais)[18].
[cit - fin]

Avant de l'installer, il faut réfléchir.
Le désinstaller est ENCORE une autre histoire !

As-tu lu ?

http://www.generation-nt.com/commenter/google-chrome-2-3-actualite-
859071.html

[cit début]
acVac29/08/2009 à 17h58
Salut,

Est-ce qu'il y quelqu'un qui a trouvé un moyen 100 % efficace pour
désinstaller Chrome, sans qu'il affecte le système ?

Après désinstallation, je ne peux plus ouvrir aucun lien Web dans mes
courriels... Vous connaissez le bobo ?

_OvO_30/08/2009 à 09h40
---Est-ce qu'il y quelqu'un qui a trouvé un moyen 100 % efficace pour
désinstaller Chrome--

il suffit de suffit de supprimer le compte utilisateur qui à
installer CHROME , puisque ces abruties de chez google on fait en
sorte que leurs daube s'installe dans le dossier "document and
setting" de l'utilisateur qui la installé. c'est dire la compétence
de ces mecs résultat si on supprime l'utilisateur , chrome disparait
avec.

comment faire confiance avec des type comme ça ???

ça c'est pour la petit histoire, sinon avant de virer CHROME il faut
déjà aller dans les services pour désactivé le "spyware" google
update qui si trouve, ensuite passer par ajout/sup de programme du
système. et pour être sur , utiliser un éditeur de registre , y
rechercher le mot GOOGLE et CHROME et TOUT Virer

Ça évite de passer dans la branche /usr/local qui nécessite des
privilèges d'administrateur, et qui impacte l'ensemble du système.
Maxime8130/08/2009 à 11h34

mais qu'est ce que c'est que ces blaireaux qui viennent mettre le
cirque dans NOS machine comme si c'était chez eux ?

c'est comme ceux qui crois que parce que l'on installe leurs
application , il ont le monopole du système. comme REAL et quick
times par exemple.

non non ce n'est pas une histoire de simplicité c'est tout simplement
du foutage de gueule. Il profite de incompétence de l'utilisateur
communs pour leurs IMPOSER leurs "systéme" , c'est tout..........
Solidsnake30/08/2009 à 13h05

je parle des concepteurs d'applications qui ce croient tout permis.

bien que j'ai une net préférence pour la philosophie des concepteurs
d'application linux qui consiste a faire une application de base
opérationnel que l'on peut personnaliser a coup de modules
complémentaires.

il n'en reste pas moins que , dans ce qu'il est courant d' appelé "le
monde libre" que moi je nomme "libre de droit" , ils existe aussi ce
genre d'énergumènes envahisseur de système.

mais c'est un opinion toute personnel , certain préfère laisser les
applications faire comme bon leurs semble, c'est un choix , mais ce
n'est pas le mien.

Luchy31/08/2009 à 01h51
Maxime81, KerTiaM >Bien entendu, ils ont raison de foutre des
binaires dans Application _data_ c'est une bonne pratique et une
nécessité.

[cit - fin]

Google Chrome ? NON Merci.
__
CB
C&C
Avatar
Gérard Menvussa
Pierre Maurette écrivit dans
news::

Google Chrome
permet également un copié-collé propre.



Mais aussi :

[cit] Attention, Google prévient que cette version est incompatible
avec la galerie de thèmes permettant de personnaliser l'interface du
navigateur. [cit]

! et mes polices de caractère, fond d'écran couleurs Windows que
j'utilise pour visionner TOUS les sites !! ;-(
__
Gérard
Avatar
_Dine & Clau_
Salut,

Pour revenir à nos moutons, il faut en revenir à mon premier jet.


Ce qui donne :

awk.bat (final)
---------------------------------------------
gawk "{if (NR/2 != int(NR/2)) { print $i } }" IN.txt > OUT.txt
gawk "{if (NR/2 == int(NR/2)) { print $i } }" IN.txt > OUT2.txt

copy out.txt c:testout*LE.*
copy out2.txt c:testout*FR.*
----------------------------------------------
C:test

05/09/2009 13:29 <DIR> in
05/09/2009 13:48 <DIR> out
05/09/2009 13:50 194 awk.bat
04/09/2009 16:49 1.932 in.txt

C:test>awk

C:test>gawk "{if (NR/2 != int(NR/2)) { print $i } }" IN.txt
1>OUT.txt

C:test>gawk "{if (NR/2 == int(NR/2)) { print $i } }" IN.txt
1>OUT2.txt
C:test>copy out.txt c:testout*LE.*
1 file(s) copied.
C:test>copy out2.txt c:testout*FR.*
1 file(s) copied.
C:testout>dir

05/09/2009 14:21 <DIR> .
05/09/2009 14:21 <DIR> ..
05/09/2009 13:53 844 OUT.txtLE
05/09/2009 13:53 1.090 OUT2.txtFR

C:testout>type OUT.txtLE vérifie bien qu'il ne contient que de
l'anglais.

Les noms obtenus avec "copy" sont bizarres ! ::-(
__
CB
C&C
Avatar
S. A.
"_Dine & Clau_" <_Dine& écrivit dans
news:4aa0e166$0$2861$:

La preuve de l'optique "propriétaire" du programmeur html de
chez Google translate : la traduction peut être vue lue mais
doit rester inutilisable.



Objection votre Honneur ! ;+)
Si on prend l'url http://translate.google.com/translate_t#
on obtient directement deux fichiers séparés à copier-coller chacun
dans un fichier.
__
S A
Avatar
_Dine & Clau_
Salut Salvatore ! ;+)

"S. A." écrivit dans
news:4aa7abb4$0$2864$:

Objection votre Honneur ! ;+)


C'est trop; merci, merci !!

Si on prend l'url http://translate.google.com/translate_t#


OUI et c'est + facile, je devais être entré par la mauvaise porte
chez google.translate !

Mais en tous cas, awk ou gawk a été nécessaire pour mes fichiers déjà
traduits. (version avec langues imbriquées)
__
CB
C&C
1 2 3