comprendre fgets

espie

24/11/2009 à 18:05

In article <4b0bf8c0$0$969$,
Richard Delorme wrote:

Le 24/11/2009 15:47, Marc Espie a écrit :

C'est normal, sous certains OS, dont ceux de Microsoft, la fin de ligne
contient deux caractères ("nr" ou le contraire) au lien d'un seul
("n") sous Unix.

Euh non, ce que tu decris, c'est une implementation "non conforme" ou du
moins qui a decide de ne pas implementer la distinction flux binaire/flux
texte.

Tous les Unix sont donc non conformes ?

... et sur lesquels les formats de fichiers concernes sont effectivement
differents, ce qui est le cas sur windows.

espie

24/11/2009 à 18:07

In article ,
Jean-Marc Bourguet wrote:

(Marc Espie) writes:

De facon encore plus drole, d'apres 7.19.2.2, il y a tres peu
d'implementations standard dans la nature... c'est frequent d'avoir des
espaces avant le 'n', par exemple).

Quel probleme y a-t'il?

Whether space characters that are written out immediately before a
new-line character
appear when read in is implementation-defined.

Tu as raison, j'ai lu un peut vite, j'etais sur le paragraphe du dessus,
qui expliquait dans quelle mesure on relit ce qui a ete ecrit...

espie

24/11/2009 à 18:08

In article <heh122$fkl$,
Antoine Leca wrote:

while (*s == 'n' || *s == 'r') {
*s-- = '';
}

Oui ; même si c'est inutile au vu de la norme, c'est en effet une
manière solide de faire.

C'est surtout une maniere fausse, ca s'appelle un buffer underflow....

Antoine Leca

25/11/2009 à 09:31

Marc Espie a écrit :

In article <heh122$fkl$,
Antoine Leca wrote:
while (*s == 'n' || *s == 'r') {
*s-- = '';
}

Oui ; même si c'est inutile au vu de la norme, c'est en effet une
manière solide de faire.

C'est surtout une maniere fausse, ca s'appelle un buffer underflow....

Tu as raison, j'ai lu un peu trop vite, j'étais sur l'idée du paragraphe
du dessus, qui traitait des caractères CR et LF...

Antoine

-ed-

25/11/2009 à 10:32

On 24 nov, 12:49, Richard Delorme wrote:

C'est normal, sous certains OS, dont ceux de Microsoft, la fin de ligne
contient deux caractères ("nr" ou le contraire) au lien d'un seul
("n") sous Unix.
Quelque soit l'OS, si s est un pointeur vers le dernier caractère non
nul de la chaine, il suffit de vérifier son contenu pour effacer les
caractères de fin de ligne :

while (*s == 'n' || *s == 'r') {
*s-- = '';

}

Non. Vu du c, et dans un flux ouvert en mode texte, une fin de ligne
est toujours 'n', quelque soit ce que fait l'OS (n, r ou rn).

-ed-

25/11/2009 à 10:36

On 24 nov, 17:19, Antoine Leca wrote:

> while (*s == 'n' || *s == 'r') {
> *s-- = '';
> }

Oui ; même si c'est inutile au vu de la norme, c'est en effet une
manière solide de faire.

Si le flux est ouvert en mode texte, le test de 'r' est inutile à
moins qu'il s'agisse d'être compatible evec des implémentations non
conformes... Si c'est le cas, on se s'en sort plus...
.

bpascal123

25/11/2009 à 22:09

On 24 nov, 17:10, Antoine Leca wrote:

Pascal écrivit :

> Est-ce que fgets a un comportement différent selon l'OS (Djgpp
> Microsoft xp ou Linux Gcc) ?

Non.

> Parce que sous Windows le pointeur se
> trouve 1 position supplémentaire après la fin de la chaîne saisie

Huh ? Peux-tu préciser le compilateur utilisé et les options de
compilations, s'il te plaît.

Antoine

Sous Windows : djgpp
Linux : gcc
pas d'option de compilation que je sache (niveau débutant) : gcc
fichier.c -o fichier.exe ou gcc fichier.c -o fichier

candide

25/11/2009 à 23:06

-ed- a écrit :

On 24 nov, 17:19, Antoine Leca wrote:
while (*s == 'n' || *s == 'r') {
*s-- = '';
}

Oui ; même si c'est inutile au vu de la norme, c'est en effet une
manière solide de faire.

Si le flux est ouvert en mode texte, le test de 'r' est inutile à
moins qu'il s'agisse d'être compatible evec des implémentations non
conformes... Si c'est le cas, on se s'en sort plus...
.

Non conformes ? ce n'est pas la question. La Norme dit :

5.2.2 Character display semantics
(...)
Each of these escape sequences shall produce a unique
implementation-deﬁned value which can be stored in a single char object.
The external representations in a text ﬁle need not be identical to the
internal representations, and are outside the scope of this
International Standard.

et le Rationale de confirmer :

Although ISO/IEC 646 deprecates the combination of the motion to the
next line with a motion to the initial position on the line, the C
Standard uses new-line to designate the end-of-line internal code
represented by the escape sequence 'n'. While this ambiguity is perhaps
unfortunate, use of the term in the latter sense is nearly universal
within the C community. But the knowledge that this internal code has
numerous external representations depending upon operating system and
medium is equally widespread.

candide

25/11/2009 à 23:13

a écrit :

pas d'option de compilation que je sache (niveau débutant) : gcc
fichier.c -o fichier.exe ou gcc fichier.c -o fichier

Quel que soit le niveau, il est impensable de ne pas compiler avec
options allumées (minimum -Wall -Wextra), c'est vraiment le B-A-BA. Tout
cours (oral ou écrit) qui n'insiste pas sur cela doit faire l'objet des
plus vives suspicions.

-ed-

26/11/2009 à 11:16

On 25 nov, 23:06, candide wrote:

-ed- a Ã©crit :

> On 24 nov, 17:19, Antoine Leca wrote:
>>> while (*s == 'n' || *s == 'r') {
>>> Â Â *s-- = '';
>>> }
>> Oui ; mÃªme si c'est inutile au vu de la norme, c'est en effet une
>> maniÃ¨re solide de faire.

> Si le flux est ouvert en mode texte, le test de 'r' est inutile Ã
> moins qu'il s'agisse d'Ãªtre compatible evec des implÃ©mentatio ns non
> conformes... Si c'est le cas, on se s'en sort plus...
> .

Non conformes ? ce n'est pas la question. La Norme dit :

5.2.2 Character display semantics
(...)
Each of these escape sequences shall produce a unique
implementation-deï¬ned value which can be stored in a single char object.
The external representations in a text ï¬le need not be identical to the
internal representations, and are outside the scope of this
International Standard.

et le Rationale de confirmer :

Although ISO/IEC 646 deprecates the combination of the motion to the
next line with a motion to the initial position on the line, the C
Standard uses new-line to designate the end-of-line internal code
represented by the escape sequence 'n'. While this ambiguity is perhaps
unfortunate, use of the term in the latter sense is nearly universal
within the C community. But the knowledge that this internal code has
numerous external representations depending upon operating system and
medium is equally widespread.

Est-ce que tu comprends la diffÃ©rence entre reprÃ©sentation extern e (ce
qu'il y a physiquement dans le flux) et reprÃ©sentation interne (ce que
"voit" le C) ?

En binaire, il n'y a pas de diffÃ©rence, mais en mode texte il peut y
avoir des diffÃ©rences, selon le systÃ¨me :

Je le rÃ©pÃ¨te, le caractÃ¨re 'n' vu du C produit dans un flux texte
soit

LF (en C 'n') sous Unix et ses clones,
CR (en C 'r') sous Mac non unixoÃ¯de.
CRLF (en C 'r''n') sous DOS et Windows.

http://www.bien-programmer.fr/notes.php#fichiers

Si tu veux travailler avec les valeurs rÃ©elles, utilise le mode
binaire (c'est ce qu'on fait pour Ã©crire un convertisseur comme
unix2dos etc.).

On 25 nov, 23:06, candide <cand...@free.invalid> wrote:

-ed- a Ã©crit :

> On 24 nov, 17:19, Antoine Leca <r...@localhost.invalid> wrote:
>>> while (*s == 'n' || *s == 'r') {
>>> Â Â *s-- = '';
>>> }
>> Oui ; mÃªme si c'est inutile au vu de la norme, c'est en effet une
>> maniÃ¨re solide de faire.

> Si le flux est ouvert en mode texte, le test de 'r' est inutile Ã
> moins qu'il s'agisse d'Ãªtre compatible evec des implÃ©mentatio ns non
> conformes... Si c'est le cas, on se s'en sort plus...
> .

Non conformes ? ce n'est pas la question. La Norme dit :

5.2.2 Character display semantics
(...)
Each of these escape sequences shall produce a unique
implementation-deï¬ned value which can be stored in a single char object.
The external representations in a text ï¬le need not be identical to the
internal representations, and are outside the scope of this
International Standard.

et le Rationale de confirmer :

Although ISO/IEC 646 deprecates the combination of the motion to the
next line with a motion to the initial position on the line, the C
Standard uses new-line to designate the end-of-line internal code
represented by the escape sequence 'n'. While this ambiguity is perhaps
unfortunate, use of the term in the latter sense is nearly universal
within the C community. But the knowledge that this internal code has
numerous external representations depending upon operating system and
medium is equally widespread.

Est-ce que tu comprends la diffÃ©rence entre reprÃ©sentation extern e (ce
qu'il y a physiquement dans le flux) et reprÃ©sentation interne (ce que
"voit" le C) ?

En binaire, il n'y a pas de diffÃ©rence, mais en mode texte il peut y
avoir des diffÃ©rences, selon le systÃ¨me :

Je le rÃ©pÃ¨te, le caractÃ¨re 'n' vu du C produit dans un flux texte
soit

LF (en C 'n') sous Unix et ses clones,
CR (en C 'r') sous Mac non unixoÃ¯de.
CRLF (en C 'r''n') sous DOS et Windows.

http://www.bien-programmer.fr/notes.php#fichiers

Si tu veux travailler avec les valeurs rÃ©elles, utilise le mode
binaire (c'est ce qu'on fait pour Ã©crire un convertisseur comme
unix2dos etc.).

Vous avez filtré cet utilisateur ! Consultez son message

On 25 nov, 23:06, candide wrote:

-ed- a Ã©crit :

> On 24 nov, 17:19, Antoine Leca wrote:
>>> while (*s == 'n' || *s == 'r') {
>>> Â Â *s-- = '';
>>> }
>> Oui ; mÃªme si c'est inutile au vu de la norme, c'est en effet une
>> maniÃ¨re solide de faire.

> Si le flux est ouvert en mode texte, le test de 'r' est inutile Ã
> moins qu'il s'agisse d'Ãªtre compatible evec des implÃ©mentatio ns non
> conformes... Si c'est le cas, on se s'en sort plus...
> .

Non conformes ? ce n'est pas la question. La Norme dit :

5.2.2 Character display semantics
(...)
Each of these escape sequences shall produce a unique
implementation-deï¬ned value which can be stored in a single char object.
The external representations in a text ï¬le need not be identical to the
internal representations, and are outside the scope of this
International Standard.

et le Rationale de confirmer :

Although ISO/IEC 646 deprecates the combination of the motion to the
next line with a motion to the initial position on the line, the C
Standard uses new-line to designate the end-of-line internal code
represented by the escape sequence 'n'. While this ambiguity is perhaps
unfortunate, use of the term in the latter sense is nearly universal
within the C community. But the knowledge that this internal code has
numerous external representations depending upon operating system and
medium is equally widespread.

Est-ce que tu comprends la diffÃ©rence entre reprÃ©sentation extern e (ce
qu'il y a physiquement dans le flux) et reprÃ©sentation interne (ce que
"voit" le C) ?

En binaire, il n'y a pas de diffÃ©rence, mais en mode texte il peut y
avoir des diffÃ©rences, selon le systÃ¨me :

Je le rÃ©pÃ¨te, le caractÃ¨re 'n' vu du C produit dans un flux texte
soit

LF (en C 'n') sous Unix et ses clones,
CR (en C 'r') sous Mac non unixoÃ¯de.
CRLF (en C 'r''n') sous DOS et Windows.

http://www.bien-programmer.fr/notes.php#fichiers

Si tu veux travailler avec les valeurs rÃ©elles, utilise le mode
binaire (c'est ce qu'on fait pour Ã©crire un convertisseur comme
unix2dos etc.).

comprendre fgets

10 réponses

Veuillez sélectionner un problème