Ça veut surtout dire virtuelle et résidente à l'instant /t/.
Il y a 170 Mo de mémoire réservée quelque part (allocations mémoire,
bibliothèques partagées le cas échéant) qui consomment des
ressources.
Ça veut surtout dire virtuelle et résidente à l'instant /t/.
Il y a 170 Mo de mémoire réservée quelque part (allocations mémoire,
bibliothèques partagées le cas échéant) qui consomment des
ressources.
Ça veut surtout dire virtuelle et résidente à l'instant /t/.
Il y a 170 Mo de mémoire réservée quelque part (allocations mémoire,
bibliothèques partagées le cas échéant) qui consomment des
ressources.
Oui, mais de là à créer un système concurrent genre openrc juste parce
que systemd bouscule trop nos habitudes, ça va plus loin que le
phénomène sociologique classique.
Initialement, c'était un peu mes raisons. Je n'ai jamais eu les
compétences arcanes mais j'arrivais à faire ce que je voulais et je
comprenais globalement comment ça marchait.
Oui, mais de là à créer un système concurrent genre openrc juste parce
que systemd bouscule trop nos habitudes, ça va plus loin que le
phénomène sociologique classique.
Initialement, c'était un peu mes raisons. Je n'ai jamais eu les
compétences arcanes mais j'arrivais à faire ce que je voulais et je
comprenais globalement comment ça marchait.
Oui, mais de là à créer un système concurrent genre openrc juste parce
que systemd bouscule trop nos habitudes, ça va plus loin que le
phénomène sociologique classique.
Initialement, c'était un peu mes raisons. Je n'ai jamais eu les
compétences arcanes mais j'arrivais à faire ce que je voulais et je
comprenais globalement comment ça marchait.
Le 06 Jun 2020 14:58:49 GMT,
Stéphane CARPENTIER écrivait :Tu veux dire que si le F5 c'est un bordel immonde que personne ne
maîtrise c'est à cause de systemd ? Tu veux dire que sur mon poste du
boulot, lorsque je vais sur une application Extranet, si ça rame en
traversant 3 routeurs, 5 firewall et 2 F5 c'est à cause de systemd ? On
a des problèmes de réseau super compliqués indémerdable. Je n'ai jamais
entendu de critique de systemd comme source. Le réseau du boulot est
tellement pourri que pour aller sur certaines applications sur
l'Extranet il vaut mieux utiliser son ordinateur personnel.
Le problème de systemd, c'est qu'il est foutu de ne pas démarrer
correctement les interfaces réseau dans l'ordre,
voire de les renommer.
Je ne te parle pas de juste des cas particuliers qui tombent en marche
par chance. Je te dis que pour ce que je vois, systemd ne pose pas de
problème. Je travaille à la DSI d'une grosse entreprise. Je sais ce qui
pose problème sur nos applications. Parce que les gros problèmes j'en
entend parler. Si systemd faisait partie du TOP 100 des sujets, j'en
aurais forcément entendu parler à un moment où à un autre. Ça ne veut
pas dire qu'il n'y a aucun problème avec systemd, ça veut dire qu'ils ne
sont pas assez importants pour remonter. Et c'est vraiment loin d'être
la guerre que tu me décris.
À ton boulot, tu as la chance d'être devant une machine pour faire
de la maintenance.
Dans le mien, la machine est potentiellement à 1000 km sans
possibilité d'intervenir dessus.
Dans mon boulot, je n'ai pas forcément un serveur de test dans la
même configuration sous la main pour tester une migration.
La migration se fait à chaud chez le client sur ses heures de
boulot. Ça _doit_ marcher.
Dans une grosse boîte, ce genre de problème est limité parce que
l'infrastructure est beaucoup plus importante.
Tu ne vas pas avoir le même serveur qui fait
routeur/passerelle/proxy web/proxy SIP/serveur NFS/Samba/VPN/Apache
et j'en passe. Sur les configurations standard, ça passe à peu près.
C'est sur les configurations tordues que ça merdoie.
Le sujet de dégager les Windows 2003 qui continuent à
trainer c'est un vrai sujet. Le sujet des Red Hat 2 qui continuent à
trainer c'est un vrai sujet. Le sujet des applications mal codées qui
coûtent une fortune en maintenance, c'est un vrai sujet.
Mais le sujet de systemd, au boulot : tout le monde s'en bat les flanc.
Tout le monde s'en bat les flancs jusqu'au jour où vous aurez une
belle merde que personne n'avait vu venir parce que tout le monde
s'en battait les flancs et que, jusqu'ici, tout fonctionnait bien.
J'ai un client qui a fait faillite à cause, entre autres,
d'un problème comme ça.
Que ce soit pour des sauvegardes. Que ce soit pour des applications sur
le DRP, pour des applications sur le cloud, pour des applications sur
dans les centres de services. Pour des petites applications ou des gros
ERP. Pas une fois, sur tous les problèmes que j'ai pu entendre, pas une
fois quelqu'un m'a dit que c'était l'ordonnancement qui n'était pas
maîtrisé et qu'on ne pouvait pas choisir l'ordre de démarrage. Et je
vais te dire que des sujets j'en ai vu passer.
Ce que tu m'écris est ridicule.
Quand tu es devant une machine, tu te contrefiches de savoir si le
démarrage s'est passé correctement jusqu'au bout. Si un daemon ne
tourne pas, tu le lances à la main.
Lorsque tu es devant une machine pour la redémarrer et que systemd
décide de partir en attente infinie, tu as le bouton reset.
Maintenant, lorsque ça merde pour une raison indéfinie et que tu es
contraint de mettre les mains dans le cambouis, ça coûte nettement
plus cher de remettre d'équerre un système utilisant systemd qu'un
système utilisant SysV ou rcorder. Pourquoi ? Parce que le temps,
c'est de l'argent et que les solutions aux problèmes systemd
oscillent entre les problèmes de lutins et de chapelier fou. Sur le
papier, c'est simple. Dans les faits, ça peut être extrêmement tordu
parce que systemd fait des hypothèses fortes sur le fonctionnement
des programmes qu'il lance.
Le 06 Jun 2020 14:58:49 GMT,
Stéphane CARPENTIER <sc@fiat-linux.fr> écrivait :
Tu veux dire que si le F5 c'est un bordel immonde que personne ne
maîtrise c'est à cause de systemd ? Tu veux dire que sur mon poste du
boulot, lorsque je vais sur une application Extranet, si ça rame en
traversant 3 routeurs, 5 firewall et 2 F5 c'est à cause de systemd ? On
a des problèmes de réseau super compliqués indémerdable. Je n'ai jamais
entendu de critique de systemd comme source. Le réseau du boulot est
tellement pourri que pour aller sur certaines applications sur
l'Extranet il vaut mieux utiliser son ordinateur personnel.
Le problème de systemd, c'est qu'il est foutu de ne pas démarrer
correctement les interfaces réseau dans l'ordre,
voire de les renommer.
Je ne te parle pas de juste des cas particuliers qui tombent en marche
par chance. Je te dis que pour ce que je vois, systemd ne pose pas de
problème. Je travaille à la DSI d'une grosse entreprise. Je sais ce qui
pose problème sur nos applications. Parce que les gros problèmes j'en
entend parler. Si systemd faisait partie du TOP 100 des sujets, j'en
aurais forcément entendu parler à un moment où à un autre. Ça ne veut
pas dire qu'il n'y a aucun problème avec systemd, ça veut dire qu'ils ne
sont pas assez importants pour remonter. Et c'est vraiment loin d'être
la guerre que tu me décris.
À ton boulot, tu as la chance d'être devant une machine pour faire
de la maintenance.
Dans le mien, la machine est potentiellement à 1000 km sans
possibilité d'intervenir dessus.
Dans mon boulot, je n'ai pas forcément un serveur de test dans la
même configuration sous la main pour tester une migration.
La migration se fait à chaud chez le client sur ses heures de
boulot. Ça _doit_ marcher.
Dans une grosse boîte, ce genre de problème est limité parce que
l'infrastructure est beaucoup plus importante.
Tu ne vas pas avoir le même serveur qui fait
routeur/passerelle/proxy web/proxy SIP/serveur NFS/Samba/VPN/Apache
et j'en passe. Sur les configurations standard, ça passe à peu près.
C'est sur les configurations tordues que ça merdoie.
Le sujet de dégager les Windows 2003 qui continuent à
trainer c'est un vrai sujet. Le sujet des Red Hat 2 qui continuent à
trainer c'est un vrai sujet. Le sujet des applications mal codées qui
coûtent une fortune en maintenance, c'est un vrai sujet.
Mais le sujet de systemd, au boulot : tout le monde s'en bat les flanc.
Tout le monde s'en bat les flancs jusqu'au jour où vous aurez une
belle merde que personne n'avait vu venir parce que tout le monde
s'en battait les flancs et que, jusqu'ici, tout fonctionnait bien.
J'ai un client qui a fait faillite à cause, entre autres,
d'un problème comme ça.
Que ce soit pour des sauvegardes. Que ce soit pour des applications sur
le DRP, pour des applications sur le cloud, pour des applications sur
dans les centres de services. Pour des petites applications ou des gros
ERP. Pas une fois, sur tous les problèmes que j'ai pu entendre, pas une
fois quelqu'un m'a dit que c'était l'ordonnancement qui n'était pas
maîtrisé et qu'on ne pouvait pas choisir l'ordre de démarrage. Et je
vais te dire que des sujets j'en ai vu passer.
Ce que tu m'écris est ridicule.
Quand tu es devant une machine, tu te contrefiches de savoir si le
démarrage s'est passé correctement jusqu'au bout. Si un daemon ne
tourne pas, tu le lances à la main.
Lorsque tu es devant une machine pour la redémarrer et que systemd
décide de partir en attente infinie, tu as le bouton reset.
Maintenant, lorsque ça merde pour une raison indéfinie et que tu es
contraint de mettre les mains dans le cambouis, ça coûte nettement
plus cher de remettre d'équerre un système utilisant systemd qu'un
système utilisant SysV ou rcorder. Pourquoi ? Parce que le temps,
c'est de l'argent et que les solutions aux problèmes systemd
oscillent entre les problèmes de lutins et de chapelier fou. Sur le
papier, c'est simple. Dans les faits, ça peut être extrêmement tordu
parce que systemd fait des hypothèses fortes sur le fonctionnement
des programmes qu'il lance.
Le 06 Jun 2020 14:58:49 GMT,
Stéphane CARPENTIER écrivait :Tu veux dire que si le F5 c'est un bordel immonde que personne ne
maîtrise c'est à cause de systemd ? Tu veux dire que sur mon poste du
boulot, lorsque je vais sur une application Extranet, si ça rame en
traversant 3 routeurs, 5 firewall et 2 F5 c'est à cause de systemd ? On
a des problèmes de réseau super compliqués indémerdable. Je n'ai jamais
entendu de critique de systemd comme source. Le réseau du boulot est
tellement pourri que pour aller sur certaines applications sur
l'Extranet il vaut mieux utiliser son ordinateur personnel.
Le problème de systemd, c'est qu'il est foutu de ne pas démarrer
correctement les interfaces réseau dans l'ordre,
voire de les renommer.
Je ne te parle pas de juste des cas particuliers qui tombent en marche
par chance. Je te dis que pour ce que je vois, systemd ne pose pas de
problème. Je travaille à la DSI d'une grosse entreprise. Je sais ce qui
pose problème sur nos applications. Parce que les gros problèmes j'en
entend parler. Si systemd faisait partie du TOP 100 des sujets, j'en
aurais forcément entendu parler à un moment où à un autre. Ça ne veut
pas dire qu'il n'y a aucun problème avec systemd, ça veut dire qu'ils ne
sont pas assez importants pour remonter. Et c'est vraiment loin d'être
la guerre que tu me décris.
À ton boulot, tu as la chance d'être devant une machine pour faire
de la maintenance.
Dans le mien, la machine est potentiellement à 1000 km sans
possibilité d'intervenir dessus.
Dans mon boulot, je n'ai pas forcément un serveur de test dans la
même configuration sous la main pour tester une migration.
La migration se fait à chaud chez le client sur ses heures de
boulot. Ça _doit_ marcher.
Dans une grosse boîte, ce genre de problème est limité parce que
l'infrastructure est beaucoup plus importante.
Tu ne vas pas avoir le même serveur qui fait
routeur/passerelle/proxy web/proxy SIP/serveur NFS/Samba/VPN/Apache
et j'en passe. Sur les configurations standard, ça passe à peu près.
C'est sur les configurations tordues que ça merdoie.
Le sujet de dégager les Windows 2003 qui continuent à
trainer c'est un vrai sujet. Le sujet des Red Hat 2 qui continuent à
trainer c'est un vrai sujet. Le sujet des applications mal codées qui
coûtent une fortune en maintenance, c'est un vrai sujet.
Mais le sujet de systemd, au boulot : tout le monde s'en bat les flanc.
Tout le monde s'en bat les flancs jusqu'au jour où vous aurez une
belle merde que personne n'avait vu venir parce que tout le monde
s'en battait les flancs et que, jusqu'ici, tout fonctionnait bien.
J'ai un client qui a fait faillite à cause, entre autres,
d'un problème comme ça.
Que ce soit pour des sauvegardes. Que ce soit pour des applications sur
le DRP, pour des applications sur le cloud, pour des applications sur
dans les centres de services. Pour des petites applications ou des gros
ERP. Pas une fois, sur tous les problèmes que j'ai pu entendre, pas une
fois quelqu'un m'a dit que c'était l'ordonnancement qui n'était pas
maîtrisé et qu'on ne pouvait pas choisir l'ordre de démarrage. Et je
vais te dire que des sujets j'en ai vu passer.
Ce que tu m'écris est ridicule.
Quand tu es devant une machine, tu te contrefiches de savoir si le
démarrage s'est passé correctement jusqu'au bout. Si un daemon ne
tourne pas, tu le lances à la main.
Lorsque tu es devant une machine pour la redémarrer et que systemd
décide de partir en attente infinie, tu as le bouton reset.
Maintenant, lorsque ça merde pour une raison indéfinie et que tu es
contraint de mettre les mains dans le cambouis, ça coûte nettement
plus cher de remettre d'équerre un système utilisant systemd qu'un
système utilisant SysV ou rcorder. Pourquoi ? Parce que le temps,
c'est de l'argent et que les solutions aux problèmes systemd
oscillent entre les problèmes de lutins et de chapelier fou. Sur le
papier, c'est simple. Dans les faits, ça peut être extrêmement tordu
parce que systemd fait des hypothèses fortes sur le fonctionnement
des programmes qu'il lance.
Là, on se répète. Effectivement par design, systemd n'est pas conçu pour
ordonnancer le démarrage.
Là, on se répète. Effectivement par design, systemd n'est pas conçu pour
ordonnancer le démarrage.
Là, on se répète. Effectivement par design, systemd n'est pas conçu pour
ordonnancer le démarrage.
Le 06-06-2020, JKB a écrit :Le 06 Jun 2020 14:58:49 GMT,
Stéphane CARPENTIER écrivait :Tu veux dire que si le F5 c'est un bordel immonde que personne ne
maîtrise c'est à cause de systemd ? Tu veux dire que sur mon poste du
boulot, lorsque je vais sur une application Extranet, si ça rame en
traversant 3 routeurs, 5 firewall et 2 F5 c'est à cause de systemd ? On
a des problèmes de réseau super compliqués indémerdable. Je n'ai jamais
entendu de critique de systemd comme source. Le réseau du boulot est
tellement pourri que pour aller sur certaines applications sur
l'Extranet il vaut mieux utiliser son ordinateur personnel.
Le problème de systemd, c'est qu'il est foutu de ne pas démarrer
correctement les interfaces réseau dans l'ordre,
Là, on se répète. Effectivement par design, systemd n'est pas conçu pour
ordonnancer le démarrage. Donc, je ne vais pas dire que j'en suis
surpris.voire de les renommer.
Oui, il les renomme, mais quand j'ai cherché à comprendre, j'ai vu des
explications qui semblaient prédictibles et effectivement, le nom de mes
interfaces réseau était prévu.
Maintenant, sur mon laptop j'ai pas
ouatmillion d'interface réseau. Pour les routeurs/firewall/F5 et tous
les équipements réseau, je ne sais pas s'il y a du systemd dedans, mais
si à chaque démarrage il fallait tout reconfiguré parce que tout avait
été renommé ça se verrait.
Non, moi je ne fais pas de maintenance. Mais je bosse avec des gens qui
font de la maintenance. Et ils ne sont pas derrière le serveur. Ils
peuvent avoir accès au serveur, mais pour ça il faut qu'ils se
déplacent. Ce qu'ils évitent de faire, surtout pendant le confinement.Dans le mien, la machine est potentiellement à 1000 km sans
possibilité d'intervenir dessus.
Tu crois que le DRP est dans la même salle que les serveurs qu'il
redonde ? Tu crois que dans une grosse boîte les admins ont leurs
serveurs dédiés à portée de main ?
La migration se fait à chaud chez le client sur ses heures de
boulot. Ça _doit_ marcher.
Tu crois qu'une grosse boîte perd combien de million par jour quand
Internet tombe ? Il n'y a pas intérêt que ce soit un con qui ait fait
une manip à l'arrache sur un serveur quand tout tombe.
Dans une grosse boîte, ce genre de problème est limité parce que
l'infrastructure est beaucoup plus importante.
Les deux fois où j'ai entendu un mec faire tomber la prod parce qu'il
croyait être en préprod, je t'assure que ça a eu des conséquences. Et
pas que pour lui (c'était pas deux fois le même). Une fois c'était les
DNS qui étaient flingués une fois c'était l'ERP en pleine cloture
comptable.
Je ne sais pas si tu imagines les conséquences d'un plantage d'ERP en
pleine clôture comptable (une destruction de la BDD, il fallait repartir
des sauvegardes) mais je sais que je n'ai pas besoin de t'expliquer les
conséquences d'une suppression des DNS de la boîte.
Dans une grosse boîte, les virements bancaires sont envoyés au dernier
moment. Parce que l'argent est placé avant virement. Et il y a des
grosses pénalités si le virement est en retard. Il n'y a pas intérêt que
le réseau plante au moment du virement : ça coûte très cher.
Tu ne vas pas avoir le même serveur qui fait
routeur/passerelle/proxy web/proxy SIP/serveur NFS/Samba/VPN/Apache
et j'en passe. Sur les configurations standard, ça passe à peu près.
C'est sur les configurations tordues que ça merdoie.
T'as d'autres problèmes, lorsque t'as plein d'équipements avec des
équipes différentes qui gèrent les équipements, la modification d'un
équipement a souvent des conséquences imprévues et dures à trouver.
Quand c'est la femme de ménage qui débranche un rack pour brancher son
aspirateur, la cause est assez rapide à trouver bien qu'il faille se
déplacer. Mais quand c'est un système de backup qui prend la main toutes
les cinq minutes alors que c'était pas prévu et que les commandes de
haut niveau ne remontent pas les mêmes infos que les commandes de de bas
niveau, je t'assure que c'est dur à déterminer. Et c'était pas lié à
systemd, c'était la mise à jour du backup à partir du système maître qui
n'a pas été faite.Le sujet de dégager les Windows 2003 qui continuent à
trainer c'est un vrai sujet. Le sujet des Red Hat 2 qui continuent à
trainer c'est un vrai sujet. Le sujet des applications mal codées qui
coûtent une fortune en maintenance, c'est un vrai sujet.
Mais le sujet de systemd, au boulot : tout le monde s'en bat les flanc.
Tout le monde s'en bat les flancs jusqu'au jour où vous aurez une
belle merde que personne n'avait vu venir parce que tout le monde
s'en battait les flancs et que, jusqu'ici, tout fonctionnait bien.
J'ai un client qui a fait faillite à cause, entre autres,
d'un problème comme ça.
Je ne lis pas l'avenir et je ne peux pas prédire la pérennité de la
boîte. Mais ça m'étonnerait que ce soit une merde sur systemd qui la
fasse couler. Il y a beaucoup d'autres sujet plus inquiétant avant ça.
Il n'y a pas que systemd qui puisse poser des gros problèmes. Et
aujourd'hui, avec le confinement il y a des vraies complexités. Alors un
systemd qui pourrait potentiellement poser problème bien qu'il n'en ait
jamais vraiment posé, ben c'est pas la priorité. La priorité c'est la
vraie vie avec les problèmes actuels à résoudre.
Parce que quand tout le monde est confiné, les accès se font tous depuis
l'extérieur. Les salles de réunion ne sont plus utilisées, donc tout le
monde utilise l'audio et la vidéoconférence. Et là, l'infra elle a
intérêt à tenir.Que ce soit pour des sauvegardes. Que ce soit pour des applications sur
le DRP, pour des applications sur le cloud, pour des applications sur
dans les centres de services. Pour des petites applications ou des gros
ERP. Pas une fois, sur tous les problèmes que j'ai pu entendre, pas une
fois quelqu'un m'a dit que c'était l'ordonnancement qui n'était pas
maîtrisé et qu'on ne pouvait pas choisir l'ordre de démarrage. Et je
vais te dire que des sujets j'en ai vu passer.
Ce que tu m'écris est ridicule.
Pas plus que de sortir que dans une grosse boite chaque reboot est fait
avec un mec au cul de la machine qui va analyser chaque daemon et
cliquer sur reset jusqu'à ce que ça marche. Personne n'a le temps
pour ça. L'écosystème est super complexe et il y a plein de choses
automatisées.
Quand tu es devant une machine, tu te contrefiches de savoir si le
démarrage s'est passé correctement jusqu'au bout. Si un daemon ne
tourne pas, tu le lances à la main.
Non seulement il n'y a personne derrière les machines qui sont dans des
salles serveurs ou sur le cloud, mais en plus, il n'y a personne qui
regarde les daemons.
Déjà on essaye de se battre avec l'infra pour
savoir avant l'utilisateur final quand un _service_ tombe (ie : pour que
l'application web marche il faut que le serveur de BDD tourne, que le
serveur applicatif tourne et soit connecté à sa BDD et que le réseau
soit OK). Alors pour le suivi des daemons, désolé, mais les outils de
supervisions le permettent mais personne ne les analyse quand ça marche
globalement.
Il y a des sauvegardes, il y a des arrêts et redémarrages automatisés
de serveurs. Pour passer des patchs de sécurité aussi. Et si systemd
plantait tous les serveurs aussi souvent et systématiquement que tu le
dis sur tous nos serveurs, ce serait la guerre tous les jours.Lorsque tu es devant une machine pour la redémarrer et que systemd
décide de partir en attente infinie, tu as le bouton reset.
Je ne sais pas ce qui te fais imaginer que les gens sont au cul des
machines. Les serveurs quand ils ne sont pas dans le cloud, ils sont
dans des salles machines dans des racks et virtualisés. Si tu éteints
l'ESX à l'envie parce que t'as un daemon qui freeze une VM tu ne sais
même pas quelles seront les conséquences.Maintenant, lorsque ça merde pour une raison indéfinie et que tu es
contraint de mettre les mains dans le cambouis, ça coûte nettement
plus cher de remettre d'équerre un système utilisant systemd qu'un
système utilisant SysV ou rcorder. Pourquoi ? Parce que le temps,
c'est de l'argent et que les solutions aux problèmes systemd
oscillent entre les problèmes de lutins et de chapelier fou. Sur le
papier, c'est simple. Dans les faits, ça peut être extrêmement tordu
parce que systemd fait des hypothèses fortes sur le fonctionnement
des programmes qu'il lance.
Merci donc de m'avoir confirmé que si systemd c'était l'horreur pour nos
admins systems, j'en aurait entendu parlé.
Le 06-06-2020, JKB <jkb@koenigsberg.invalid> a écrit :
Le 06 Jun 2020 14:58:49 GMT,
Stéphane CARPENTIER <sc@fiat-linux.fr> écrivait :
Tu veux dire que si le F5 c'est un bordel immonde que personne ne
maîtrise c'est à cause de systemd ? Tu veux dire que sur mon poste du
boulot, lorsque je vais sur une application Extranet, si ça rame en
traversant 3 routeurs, 5 firewall et 2 F5 c'est à cause de systemd ? On
a des problèmes de réseau super compliqués indémerdable. Je n'ai jamais
entendu de critique de systemd comme source. Le réseau du boulot est
tellement pourri que pour aller sur certaines applications sur
l'Extranet il vaut mieux utiliser son ordinateur personnel.
Le problème de systemd, c'est qu'il est foutu de ne pas démarrer
correctement les interfaces réseau dans l'ordre,
Là, on se répète. Effectivement par design, systemd n'est pas conçu pour
ordonnancer le démarrage. Donc, je ne vais pas dire que j'en suis
surpris.
voire de les renommer.
Oui, il les renomme, mais quand j'ai cherché à comprendre, j'ai vu des
explications qui semblaient prédictibles et effectivement, le nom de mes
interfaces réseau était prévu.
Maintenant, sur mon laptop j'ai pas
ouatmillion d'interface réseau. Pour les routeurs/firewall/F5 et tous
les équipements réseau, je ne sais pas s'il y a du systemd dedans, mais
si à chaque démarrage il fallait tout reconfiguré parce que tout avait
été renommé ça se verrait.
Non, moi je ne fais pas de maintenance. Mais je bosse avec des gens qui
font de la maintenance. Et ils ne sont pas derrière le serveur. Ils
peuvent avoir accès au serveur, mais pour ça il faut qu'ils se
déplacent. Ce qu'ils évitent de faire, surtout pendant le confinement.
Dans le mien, la machine est potentiellement à 1000 km sans
possibilité d'intervenir dessus.
Tu crois que le DRP est dans la même salle que les serveurs qu'il
redonde ? Tu crois que dans une grosse boîte les admins ont leurs
serveurs dédiés à portée de main ?
La migration se fait à chaud chez le client sur ses heures de
boulot. Ça _doit_ marcher.
Tu crois qu'une grosse boîte perd combien de million par jour quand
Internet tombe ? Il n'y a pas intérêt que ce soit un con qui ait fait
une manip à l'arrache sur un serveur quand tout tombe.
Dans une grosse boîte, ce genre de problème est limité parce que
l'infrastructure est beaucoup plus importante.
Les deux fois où j'ai entendu un mec faire tomber la prod parce qu'il
croyait être en préprod, je t'assure que ça a eu des conséquences. Et
pas que pour lui (c'était pas deux fois le même). Une fois c'était les
DNS qui étaient flingués une fois c'était l'ERP en pleine cloture
comptable.
Je ne sais pas si tu imagines les conséquences d'un plantage d'ERP en
pleine clôture comptable (une destruction de la BDD, il fallait repartir
des sauvegardes) mais je sais que je n'ai pas besoin de t'expliquer les
conséquences d'une suppression des DNS de la boîte.
Dans une grosse boîte, les virements bancaires sont envoyés au dernier
moment. Parce que l'argent est placé avant virement. Et il y a des
grosses pénalités si le virement est en retard. Il n'y a pas intérêt que
le réseau plante au moment du virement : ça coûte très cher.
Tu ne vas pas avoir le même serveur qui fait
routeur/passerelle/proxy web/proxy SIP/serveur NFS/Samba/VPN/Apache
et j'en passe. Sur les configurations standard, ça passe à peu près.
C'est sur les configurations tordues que ça merdoie.
T'as d'autres problèmes, lorsque t'as plein d'équipements avec des
équipes différentes qui gèrent les équipements, la modification d'un
équipement a souvent des conséquences imprévues et dures à trouver.
Quand c'est la femme de ménage qui débranche un rack pour brancher son
aspirateur, la cause est assez rapide à trouver bien qu'il faille se
déplacer. Mais quand c'est un système de backup qui prend la main toutes
les cinq minutes alors que c'était pas prévu et que les commandes de
haut niveau ne remontent pas les mêmes infos que les commandes de de bas
niveau, je t'assure que c'est dur à déterminer. Et c'était pas lié à
systemd, c'était la mise à jour du backup à partir du système maître qui
n'a pas été faite.
Le sujet de dégager les Windows 2003 qui continuent à
trainer c'est un vrai sujet. Le sujet des Red Hat 2 qui continuent à
trainer c'est un vrai sujet. Le sujet des applications mal codées qui
coûtent une fortune en maintenance, c'est un vrai sujet.
Mais le sujet de systemd, au boulot : tout le monde s'en bat les flanc.
Tout le monde s'en bat les flancs jusqu'au jour où vous aurez une
belle merde que personne n'avait vu venir parce que tout le monde
s'en battait les flancs et que, jusqu'ici, tout fonctionnait bien.
J'ai un client qui a fait faillite à cause, entre autres,
d'un problème comme ça.
Je ne lis pas l'avenir et je ne peux pas prédire la pérennité de la
boîte. Mais ça m'étonnerait que ce soit une merde sur systemd qui la
fasse couler. Il y a beaucoup d'autres sujet plus inquiétant avant ça.
Il n'y a pas que systemd qui puisse poser des gros problèmes. Et
aujourd'hui, avec le confinement il y a des vraies complexités. Alors un
systemd qui pourrait potentiellement poser problème bien qu'il n'en ait
jamais vraiment posé, ben c'est pas la priorité. La priorité c'est la
vraie vie avec les problèmes actuels à résoudre.
Parce que quand tout le monde est confiné, les accès se font tous depuis
l'extérieur. Les salles de réunion ne sont plus utilisées, donc tout le
monde utilise l'audio et la vidéoconférence. Et là, l'infra elle a
intérêt à tenir.
Que ce soit pour des sauvegardes. Que ce soit pour des applications sur
le DRP, pour des applications sur le cloud, pour des applications sur
dans les centres de services. Pour des petites applications ou des gros
ERP. Pas une fois, sur tous les problèmes que j'ai pu entendre, pas une
fois quelqu'un m'a dit que c'était l'ordonnancement qui n'était pas
maîtrisé et qu'on ne pouvait pas choisir l'ordre de démarrage. Et je
vais te dire que des sujets j'en ai vu passer.
Ce que tu m'écris est ridicule.
Pas plus que de sortir que dans une grosse boite chaque reboot est fait
avec un mec au cul de la machine qui va analyser chaque daemon et
cliquer sur reset jusqu'à ce que ça marche. Personne n'a le temps
pour ça. L'écosystème est super complexe et il y a plein de choses
automatisées.
Quand tu es devant une machine, tu te contrefiches de savoir si le
démarrage s'est passé correctement jusqu'au bout. Si un daemon ne
tourne pas, tu le lances à la main.
Non seulement il n'y a personne derrière les machines qui sont dans des
salles serveurs ou sur le cloud, mais en plus, il n'y a personne qui
regarde les daemons.
Déjà on essaye de se battre avec l'infra pour
savoir avant l'utilisateur final quand un _service_ tombe (ie : pour que
l'application web marche il faut que le serveur de BDD tourne, que le
serveur applicatif tourne et soit connecté à sa BDD et que le réseau
soit OK). Alors pour le suivi des daemons, désolé, mais les outils de
supervisions le permettent mais personne ne les analyse quand ça marche
globalement.
Il y a des sauvegardes, il y a des arrêts et redémarrages automatisés
de serveurs. Pour passer des patchs de sécurité aussi. Et si systemd
plantait tous les serveurs aussi souvent et systématiquement que tu le
dis sur tous nos serveurs, ce serait la guerre tous les jours.
Lorsque tu es devant une machine pour la redémarrer et que systemd
décide de partir en attente infinie, tu as le bouton reset.
Je ne sais pas ce qui te fais imaginer que les gens sont au cul des
machines. Les serveurs quand ils ne sont pas dans le cloud, ils sont
dans des salles machines dans des racks et virtualisés. Si tu éteints
l'ESX à l'envie parce que t'as un daemon qui freeze une VM tu ne sais
même pas quelles seront les conséquences.
Maintenant, lorsque ça merde pour une raison indéfinie et que tu es
contraint de mettre les mains dans le cambouis, ça coûte nettement
plus cher de remettre d'équerre un système utilisant systemd qu'un
système utilisant SysV ou rcorder. Pourquoi ? Parce que le temps,
c'est de l'argent et que les solutions aux problèmes systemd
oscillent entre les problèmes de lutins et de chapelier fou. Sur le
papier, c'est simple. Dans les faits, ça peut être extrêmement tordu
parce que systemd fait des hypothèses fortes sur le fonctionnement
des programmes qu'il lance.
Merci donc de m'avoir confirmé que si systemd c'était l'horreur pour nos
admins systems, j'en aurait entendu parlé.
Le 06-06-2020, JKB a écrit :Le 06 Jun 2020 14:58:49 GMT,
Stéphane CARPENTIER écrivait :Tu veux dire que si le F5 c'est un bordel immonde que personne ne
maîtrise c'est à cause de systemd ? Tu veux dire que sur mon poste du
boulot, lorsque je vais sur une application Extranet, si ça rame en
traversant 3 routeurs, 5 firewall et 2 F5 c'est à cause de systemd ? On
a des problèmes de réseau super compliqués indémerdable. Je n'ai jamais
entendu de critique de systemd comme source. Le réseau du boulot est
tellement pourri que pour aller sur certaines applications sur
l'Extranet il vaut mieux utiliser son ordinateur personnel.
Le problème de systemd, c'est qu'il est foutu de ne pas démarrer
correctement les interfaces réseau dans l'ordre,
Là, on se répète. Effectivement par design, systemd n'est pas conçu pour
ordonnancer le démarrage. Donc, je ne vais pas dire que j'en suis
surpris.voire de les renommer.
Oui, il les renomme, mais quand j'ai cherché à comprendre, j'ai vu des
explications qui semblaient prédictibles et effectivement, le nom de mes
interfaces réseau était prévu.
Maintenant, sur mon laptop j'ai pas
ouatmillion d'interface réseau. Pour les routeurs/firewall/F5 et tous
les équipements réseau, je ne sais pas s'il y a du systemd dedans, mais
si à chaque démarrage il fallait tout reconfiguré parce que tout avait
été renommé ça se verrait.
Non, moi je ne fais pas de maintenance. Mais je bosse avec des gens qui
font de la maintenance. Et ils ne sont pas derrière le serveur. Ils
peuvent avoir accès au serveur, mais pour ça il faut qu'ils se
déplacent. Ce qu'ils évitent de faire, surtout pendant le confinement.Dans le mien, la machine est potentiellement à 1000 km sans
possibilité d'intervenir dessus.
Tu crois que le DRP est dans la même salle que les serveurs qu'il
redonde ? Tu crois que dans une grosse boîte les admins ont leurs
serveurs dédiés à portée de main ?
La migration se fait à chaud chez le client sur ses heures de
boulot. Ça _doit_ marcher.
Tu crois qu'une grosse boîte perd combien de million par jour quand
Internet tombe ? Il n'y a pas intérêt que ce soit un con qui ait fait
une manip à l'arrache sur un serveur quand tout tombe.
Dans une grosse boîte, ce genre de problème est limité parce que
l'infrastructure est beaucoup plus importante.
Les deux fois où j'ai entendu un mec faire tomber la prod parce qu'il
croyait être en préprod, je t'assure que ça a eu des conséquences. Et
pas que pour lui (c'était pas deux fois le même). Une fois c'était les
DNS qui étaient flingués une fois c'était l'ERP en pleine cloture
comptable.
Je ne sais pas si tu imagines les conséquences d'un plantage d'ERP en
pleine clôture comptable (une destruction de la BDD, il fallait repartir
des sauvegardes) mais je sais que je n'ai pas besoin de t'expliquer les
conséquences d'une suppression des DNS de la boîte.
Dans une grosse boîte, les virements bancaires sont envoyés au dernier
moment. Parce que l'argent est placé avant virement. Et il y a des
grosses pénalités si le virement est en retard. Il n'y a pas intérêt que
le réseau plante au moment du virement : ça coûte très cher.
Tu ne vas pas avoir le même serveur qui fait
routeur/passerelle/proxy web/proxy SIP/serveur NFS/Samba/VPN/Apache
et j'en passe. Sur les configurations standard, ça passe à peu près.
C'est sur les configurations tordues que ça merdoie.
T'as d'autres problèmes, lorsque t'as plein d'équipements avec des
équipes différentes qui gèrent les équipements, la modification d'un
équipement a souvent des conséquences imprévues et dures à trouver.
Quand c'est la femme de ménage qui débranche un rack pour brancher son
aspirateur, la cause est assez rapide à trouver bien qu'il faille se
déplacer. Mais quand c'est un système de backup qui prend la main toutes
les cinq minutes alors que c'était pas prévu et que les commandes de
haut niveau ne remontent pas les mêmes infos que les commandes de de bas
niveau, je t'assure que c'est dur à déterminer. Et c'était pas lié à
systemd, c'était la mise à jour du backup à partir du système maître qui
n'a pas été faite.Le sujet de dégager les Windows 2003 qui continuent à
trainer c'est un vrai sujet. Le sujet des Red Hat 2 qui continuent à
trainer c'est un vrai sujet. Le sujet des applications mal codées qui
coûtent une fortune en maintenance, c'est un vrai sujet.
Mais le sujet de systemd, au boulot : tout le monde s'en bat les flanc.
Tout le monde s'en bat les flancs jusqu'au jour où vous aurez une
belle merde que personne n'avait vu venir parce que tout le monde
s'en battait les flancs et que, jusqu'ici, tout fonctionnait bien.
J'ai un client qui a fait faillite à cause, entre autres,
d'un problème comme ça.
Je ne lis pas l'avenir et je ne peux pas prédire la pérennité de la
boîte. Mais ça m'étonnerait que ce soit une merde sur systemd qui la
fasse couler. Il y a beaucoup d'autres sujet plus inquiétant avant ça.
Il n'y a pas que systemd qui puisse poser des gros problèmes. Et
aujourd'hui, avec le confinement il y a des vraies complexités. Alors un
systemd qui pourrait potentiellement poser problème bien qu'il n'en ait
jamais vraiment posé, ben c'est pas la priorité. La priorité c'est la
vraie vie avec les problèmes actuels à résoudre.
Parce que quand tout le monde est confiné, les accès se font tous depuis
l'extérieur. Les salles de réunion ne sont plus utilisées, donc tout le
monde utilise l'audio et la vidéoconférence. Et là, l'infra elle a
intérêt à tenir.Que ce soit pour des sauvegardes. Que ce soit pour des applications sur
le DRP, pour des applications sur le cloud, pour des applications sur
dans les centres de services. Pour des petites applications ou des gros
ERP. Pas une fois, sur tous les problèmes que j'ai pu entendre, pas une
fois quelqu'un m'a dit que c'était l'ordonnancement qui n'était pas
maîtrisé et qu'on ne pouvait pas choisir l'ordre de démarrage. Et je
vais te dire que des sujets j'en ai vu passer.
Ce que tu m'écris est ridicule.
Pas plus que de sortir que dans une grosse boite chaque reboot est fait
avec un mec au cul de la machine qui va analyser chaque daemon et
cliquer sur reset jusqu'à ce que ça marche. Personne n'a le temps
pour ça. L'écosystème est super complexe et il y a plein de choses
automatisées.
Quand tu es devant une machine, tu te contrefiches de savoir si le
démarrage s'est passé correctement jusqu'au bout. Si un daemon ne
tourne pas, tu le lances à la main.
Non seulement il n'y a personne derrière les machines qui sont dans des
salles serveurs ou sur le cloud, mais en plus, il n'y a personne qui
regarde les daemons.
Déjà on essaye de se battre avec l'infra pour
savoir avant l'utilisateur final quand un _service_ tombe (ie : pour que
l'application web marche il faut que le serveur de BDD tourne, que le
serveur applicatif tourne et soit connecté à sa BDD et que le réseau
soit OK). Alors pour le suivi des daemons, désolé, mais les outils de
supervisions le permettent mais personne ne les analyse quand ça marche
globalement.
Il y a des sauvegardes, il y a des arrêts et redémarrages automatisés
de serveurs. Pour passer des patchs de sécurité aussi. Et si systemd
plantait tous les serveurs aussi souvent et systématiquement que tu le
dis sur tous nos serveurs, ce serait la guerre tous les jours.Lorsque tu es devant une machine pour la redémarrer et que systemd
décide de partir en attente infinie, tu as le bouton reset.
Je ne sais pas ce qui te fais imaginer que les gens sont au cul des
machines. Les serveurs quand ils ne sont pas dans le cloud, ils sont
dans des salles machines dans des racks et virtualisés. Si tu éteints
l'ESX à l'envie parce que t'as un daemon qui freeze une VM tu ne sais
même pas quelles seront les conséquences.Maintenant, lorsque ça merde pour une raison indéfinie et que tu es
contraint de mettre les mains dans le cambouis, ça coûte nettement
plus cher de remettre d'équerre un système utilisant systemd qu'un
système utilisant SysV ou rcorder. Pourquoi ? Parce que le temps,
c'est de l'argent et que les solutions aux problèmes systemd
oscillent entre les problèmes de lutins et de chapelier fou. Sur le
papier, c'est simple. Dans les faits, ça peut être extrêmement tordu
parce que systemd fait des hypothèses fortes sur le fonctionnement
des programmes qu'il lance.
Merci donc de m'avoir confirmé que si systemd c'était l'horreur pour nos
admins systems, j'en aurait entendu parlé.
Le 06 Jun 2020 10:41:26 GMT,
Stéphane CARPENTIER écrivait :Comme je l'ai déjà dit, sur un poste de travail moderne, avec
KDE/Gnome/Plama/Compiz/FireFox/whatever je ne peux pas croire que ce
soit systemd qui bouffe toutes les ressources.
Soyons joueur...
Configuration : i7, 32 Go de mémoire. Heureusement qu'il y a 32 Go
de mémoire parce que, je viens de vérifier, le processus de PID 1
consomme 170,6 Mo de mémoire.
Le 06 Jun 2020 10:41:26 GMT,
Stéphane CARPENTIER <sc@fiat-linux.fr> écrivait :
Comme je l'ai déjà dit, sur un poste de travail moderne, avec
KDE/Gnome/Plama/Compiz/FireFox/whatever je ne peux pas croire que ce
soit systemd qui bouffe toutes les ressources.
Soyons joueur...
Configuration : i7, 32 Go de mémoire. Heureusement qu'il y a 32 Go
de mémoire parce que, je viens de vérifier, le processus de PID 1
consomme 170,6 Mo de mémoire.
Le 06 Jun 2020 10:41:26 GMT,
Stéphane CARPENTIER écrivait :Comme je l'ai déjà dit, sur un poste de travail moderne, avec
KDE/Gnome/Plama/Compiz/FireFox/whatever je ne peux pas croire que ce
soit systemd qui bouffe toutes les ressources.
Soyons joueur...
Configuration : i7, 32 Go de mémoire. Heureusement qu'il y a 32 Go
de mémoire parce que, je viens de vérifier, le processus de PID 1
consomme 170,6 Mo de mémoire.
Le 06 Jun 2020 18:50:15 GMT,
Stéphane CARPENTIER écrivait :Le 06-06-2020, JKB a écrit :Le 06 Jun 2020 14:58:49 GMT,
voire de les renommer.
Oui, il les renomme, mais quand j'ai cherché à comprendre, j'ai vu des
explications qui semblaient prédictibles et effectivement, le nom de mes
interfaces réseau était prévu.
Ça, c'est en absence de bug. Il y a eu une mouture du bousin qui
n'interragissait pas correctement avec udev et qui donnait un
résultat folklorique. Par design, systemd est un nid à bugs parce
qu'il est tout sauf simple et trivial.
Maintenant, sur mon laptop j'ai pas
ouatmillion d'interface réseau. Pour les routeurs/firewall/F5 et tous
les équipements réseau, je ne sais pas s'il y a du systemd dedans, mais
si à chaque démarrage il fallait tout reconfiguré parce que tout avait
été renommé ça se verrait.
Tu le vois lors d'un redémarrage. Ces machines sont rarement
redémarrées.
La migration se fait à chaud chez le client sur ses heures de
boulot. Ça _doit_ marcher.
Tu crois qu'une grosse boîte perd combien de million par jour quand
Internet tombe ? Il n'y a pas intérêt que ce soit un con qui ait fait
une manip à l'arrache sur un serveur quand tout tombe.
Ce n'est pas vrai, tu le fait exprès. Une grosse boîte à les moyens
d'avoir des serveurs de test sur lesquels tu peux vérifier que telle
migration se passe bien.
En d'autres termes, la grosse boîte, si une migration se passe mal,
ne peut s'en prendre qu'à elle-même.
Dans une grosse boîte, ce genre de problème est limité parce que
l'infrastructure est beaucoup plus importante.
Les deux fois où j'ai entendu un mec faire tomber la prod parce qu'il
croyait être en préprod, je t'assure que ça a eu des conséquences. Et
pas que pour lui (c'était pas deux fois le même). Une fois c'était les
DNS qui étaient flingués une fois c'était l'ERP en pleine cloture
comptable.
Je ne sais pas si tu imagines les conséquences d'un plantage d'ERP en
pleine clôture comptable (une destruction de la BDD, il fallait repartir
des sauvegardes) mais je sais que je n'ai pas besoin de t'expliquer les
conséquences d'une suppression des DNS de la boîte.
Dans une grosse boîte, les virements bancaires sont envoyés au dernier
moment. Parce que l'argent est placé avant virement. Et il y a des
grosses pénalités si le virement est en retard. Il n'y a pas intérêt que
le réseau plante au moment du virement : ça coûte très cher.
Une grosse boîte a les moyens d'éviter ce genre de chose. Et sinon,
pour ta gouverne, je suis chef d'entreprise, j'ai une vague idée du
merdier qui est derrière un plantage d'ERP.
Dans une grosse boîte, tu as toujours un accès à tes serveurs (KVM,
bandeau APC ou autre). Tu peux toujours in fine récupérer la main
sur une machine physiquement ou comme si tu étais physiquement
devant.
Quand tu es devant une machine, tu te contrefiches de savoir si le
démarrage s'est passé correctement jusqu'au bout. Si un daemon ne
tourne pas, tu le lances à la main.
Non seulement il n'y a personne derrière les machines qui sont dans des
salles serveurs ou sur le cloud, mais en plus, il n'y a personne qui
regarde les daemons.
Le monitoring, tu n'as jamais entendu parler de cela ? Moi, sur les
pauvres serveurs de ma boîte, j'ai des alertes qui remontent si tel
ou tel service ne fonctionne pas. Ça m'étonnerait beaucoup que ce ne
soit pas le cas sur les infrastructures des grosses boîtes.
Merci donc de m'avoir confirmé que si systemd c'était l'horreur pour nos
admins systems, j'en aurait entendu parlé.
Mais tu choisis les poisons que tu veux, mon grand.
Le fait que tu n'aies jamais vu un problème ne signifie pas qu'il
n'y en a pas.
Le 06 Jun 2020 18:50:15 GMT,
Stéphane CARPENTIER <sc@fiat-linux.fr> écrivait :
Le 06-06-2020, JKB <jkb@koenigsberg.invalid> a écrit :
Le 06 Jun 2020 14:58:49 GMT,
voire de les renommer.
Oui, il les renomme, mais quand j'ai cherché à comprendre, j'ai vu des
explications qui semblaient prédictibles et effectivement, le nom de mes
interfaces réseau était prévu.
Ça, c'est en absence de bug. Il y a eu une mouture du bousin qui
n'interragissait pas correctement avec udev et qui donnait un
résultat folklorique. Par design, systemd est un nid à bugs parce
qu'il est tout sauf simple et trivial.
Maintenant, sur mon laptop j'ai pas
ouatmillion d'interface réseau. Pour les routeurs/firewall/F5 et tous
les équipements réseau, je ne sais pas s'il y a du systemd dedans, mais
si à chaque démarrage il fallait tout reconfiguré parce que tout avait
été renommé ça se verrait.
Tu le vois lors d'un redémarrage. Ces machines sont rarement
redémarrées.
La migration se fait à chaud chez le client sur ses heures de
boulot. Ça _doit_ marcher.
Tu crois qu'une grosse boîte perd combien de million par jour quand
Internet tombe ? Il n'y a pas intérêt que ce soit un con qui ait fait
une manip à l'arrache sur un serveur quand tout tombe.
Ce n'est pas vrai, tu le fait exprès. Une grosse boîte à les moyens
d'avoir des serveurs de test sur lesquels tu peux vérifier que telle
migration se passe bien.
En d'autres termes, la grosse boîte, si une migration se passe mal,
ne peut s'en prendre qu'à elle-même.
Dans une grosse boîte, ce genre de problème est limité parce que
l'infrastructure est beaucoup plus importante.
Les deux fois où j'ai entendu un mec faire tomber la prod parce qu'il
croyait être en préprod, je t'assure que ça a eu des conséquences. Et
pas que pour lui (c'était pas deux fois le même). Une fois c'était les
DNS qui étaient flingués une fois c'était l'ERP en pleine cloture
comptable.
Je ne sais pas si tu imagines les conséquences d'un plantage d'ERP en
pleine clôture comptable (une destruction de la BDD, il fallait repartir
des sauvegardes) mais je sais que je n'ai pas besoin de t'expliquer les
conséquences d'une suppression des DNS de la boîte.
Dans une grosse boîte, les virements bancaires sont envoyés au dernier
moment. Parce que l'argent est placé avant virement. Et il y a des
grosses pénalités si le virement est en retard. Il n'y a pas intérêt que
le réseau plante au moment du virement : ça coûte très cher.
Une grosse boîte a les moyens d'éviter ce genre de chose. Et sinon,
pour ta gouverne, je suis chef d'entreprise, j'ai une vague idée du
merdier qui est derrière un plantage d'ERP.
Dans une grosse boîte, tu as toujours un accès à tes serveurs (KVM,
bandeau APC ou autre). Tu peux toujours in fine récupérer la main
sur une machine physiquement ou comme si tu étais physiquement
devant.
Quand tu es devant une machine, tu te contrefiches de savoir si le
démarrage s'est passé correctement jusqu'au bout. Si un daemon ne
tourne pas, tu le lances à la main.
Non seulement il n'y a personne derrière les machines qui sont dans des
salles serveurs ou sur le cloud, mais en plus, il n'y a personne qui
regarde les daemons.
Le monitoring, tu n'as jamais entendu parler de cela ? Moi, sur les
pauvres serveurs de ma boîte, j'ai des alertes qui remontent si tel
ou tel service ne fonctionne pas. Ça m'étonnerait beaucoup que ce ne
soit pas le cas sur les infrastructures des grosses boîtes.
Merci donc de m'avoir confirmé que si systemd c'était l'horreur pour nos
admins systems, j'en aurait entendu parlé.
Mais tu choisis les poisons que tu veux, mon grand.
Le fait que tu n'aies jamais vu un problème ne signifie pas qu'il
n'y en a pas.
Le 06 Jun 2020 18:50:15 GMT,
Stéphane CARPENTIER écrivait :Le 06-06-2020, JKB a écrit :Le 06 Jun 2020 14:58:49 GMT,
voire de les renommer.
Oui, il les renomme, mais quand j'ai cherché à comprendre, j'ai vu des
explications qui semblaient prédictibles et effectivement, le nom de mes
interfaces réseau était prévu.
Ça, c'est en absence de bug. Il y a eu une mouture du bousin qui
n'interragissait pas correctement avec udev et qui donnait un
résultat folklorique. Par design, systemd est un nid à bugs parce
qu'il est tout sauf simple et trivial.
Maintenant, sur mon laptop j'ai pas
ouatmillion d'interface réseau. Pour les routeurs/firewall/F5 et tous
les équipements réseau, je ne sais pas s'il y a du systemd dedans, mais
si à chaque démarrage il fallait tout reconfiguré parce que tout avait
été renommé ça se verrait.
Tu le vois lors d'un redémarrage. Ces machines sont rarement
redémarrées.
La migration se fait à chaud chez le client sur ses heures de
boulot. Ça _doit_ marcher.
Tu crois qu'une grosse boîte perd combien de million par jour quand
Internet tombe ? Il n'y a pas intérêt que ce soit un con qui ait fait
une manip à l'arrache sur un serveur quand tout tombe.
Ce n'est pas vrai, tu le fait exprès. Une grosse boîte à les moyens
d'avoir des serveurs de test sur lesquels tu peux vérifier que telle
migration se passe bien.
En d'autres termes, la grosse boîte, si une migration se passe mal,
ne peut s'en prendre qu'à elle-même.
Dans une grosse boîte, ce genre de problème est limité parce que
l'infrastructure est beaucoup plus importante.
Les deux fois où j'ai entendu un mec faire tomber la prod parce qu'il
croyait être en préprod, je t'assure que ça a eu des conséquences. Et
pas que pour lui (c'était pas deux fois le même). Une fois c'était les
DNS qui étaient flingués une fois c'était l'ERP en pleine cloture
comptable.
Je ne sais pas si tu imagines les conséquences d'un plantage d'ERP en
pleine clôture comptable (une destruction de la BDD, il fallait repartir
des sauvegardes) mais je sais que je n'ai pas besoin de t'expliquer les
conséquences d'une suppression des DNS de la boîte.
Dans une grosse boîte, les virements bancaires sont envoyés au dernier
moment. Parce que l'argent est placé avant virement. Et il y a des
grosses pénalités si le virement est en retard. Il n'y a pas intérêt que
le réseau plante au moment du virement : ça coûte très cher.
Une grosse boîte a les moyens d'éviter ce genre de chose. Et sinon,
pour ta gouverne, je suis chef d'entreprise, j'ai une vague idée du
merdier qui est derrière un plantage d'ERP.
Dans une grosse boîte, tu as toujours un accès à tes serveurs (KVM,
bandeau APC ou autre). Tu peux toujours in fine récupérer la main
sur une machine physiquement ou comme si tu étais physiquement
devant.
Quand tu es devant une machine, tu te contrefiches de savoir si le
démarrage s'est passé correctement jusqu'au bout. Si un daemon ne
tourne pas, tu le lances à la main.
Non seulement il n'y a personne derrière les machines qui sont dans des
salles serveurs ou sur le cloud, mais en plus, il n'y a personne qui
regarde les daemons.
Le monitoring, tu n'as jamais entendu parler de cela ? Moi, sur les
pauvres serveurs de ma boîte, j'ai des alertes qui remontent si tel
ou tel service ne fonctionne pas. Ça m'étonnerait beaucoup que ce ne
soit pas le cas sur les infrastructures des grosses boîtes.
Merci donc de m'avoir confirmé que si systemd c'était l'horreur pour nos
admins systems, j'en aurait entendu parlé.
Mais tu choisis les poisons que tu veux, mon grand.
Le fait que tu n'aies jamais vu un problème ne signifie pas qu'il
n'y en a pas.
Stéphane CARPENTIER , dans le message
, a écrit :Là, on se répète. Effectivement par design, systemd n'est pas conçu pour
ordonnancer le démarrage.
En fait, si on y tient vraiment, on peut parfaitement décider l'ordre de
lancement des services avec systemd : il suffit de mettre des directives
Requires et After à tous les services.
Mais quel intérêt ?
Stéphane CARPENTIER , dans le message
<slrnrdnpb7.qo.sc@scarpet42p.localdomain>, a écrit :
Là, on se répète. Effectivement par design, systemd n'est pas conçu pour
ordonnancer le démarrage.
En fait, si on y tient vraiment, on peut parfaitement décider l'ordre de
lancement des services avec systemd : il suffit de mettre des directives
Requires et After à tous les services.
Mais quel intérêt ?
Stéphane CARPENTIER , dans le message
, a écrit :Là, on se répète. Effectivement par design, systemd n'est pas conçu pour
ordonnancer le démarrage.
En fait, si on y tient vraiment, on peut parfaitement décider l'ordre de
lancement des services avec systemd : il suffit de mettre des directives
Requires et After à tous les services.
Mais quel intérêt ?
Le Sat, 6 Jun 2020 13:58:28 -0000 (UTC),
Yliur écrivait :Le Sat, 06 Jun 2020 12:34:07 +0000, JKB a écrit :Pour fixer les idées :
https://github.com/systemd/systemd/issues 1224 open, 5016 closed.
Sauf que dans la liste il y a des choses qui vont du bug à la demande
d'amélioration, en passant par des questions limite forum (du type "je
ne vois pas comment faire ça", sans que ça ait forcément (encore) été
trié comme demande d'amélioration)
Si on ne considère que l'étiquette "bug", on a ça : 89 open, 829
closed.
Il se peut qu'en réalité ce soit un peu plus, mais prendre le chiffre
brut sans même regarder ce qu'il y a dedans c'est de la mauvaise foi
quand même...
Même s'il n'y en a _que_ 1000, ça fait beaucoup pour un daemon qui
devrait être trivial et entièrement prouvé (parce que c'est tout
de même sur lui que repose la stabilité du système).
Soyons joueur...
Configuration : i7, 32 Go de mémoire. Heureusement qu'il y a 32
Go de mémoire parce que, je viens de vérifier, le processus de
PID 1 consomme 170,6 Mo de mémoire. Et il n'est même pas
verrouillé en mémoire !
Chez moi aussi, sauf que top dit ça :
VIRT : 175288 RES : 5292 %MEM : 0,0
Donc si je comprends bien, 170Mo de mémoire virtuelle mais seulement
5Mo de mémoire réservée. Ce qui peut aussi bien signifier que plein de
code est associé à la mémoire virtuelle du processus mais que ce n'est
pas forcément chargé en mémoire.
Ça veut surtout dire virtuelle et résidente à l'instant /t/.
Il y a 170 Mo de mémoire réservée quelque part (allocations
mémoire, bibliothèques partagées le cas échéant) qui consomment
des ressources.
Mais pourquoi le fait qu'un bout de code du système d'initialisation
qui ne sert jamais reste en mémoire est plus pertinent que pour
n'importe quel processus ?
Parce que init doit récupérer tout un tas de choses dont les
codes de retour de tous les processus sous peine d'avoir des
zombies. Pour mémoire, un zombie, c'est un processus dont le père
ou init n'est pas allé à l'enterrement. Si à chaque fois qu'un
processus lancé par init s'achève, que init est dans le swap et
que ton système va chercher les pages dans le swap pour
simplement lire la valeur de retour du fils, je pense que tu vas
assez rapidement t'énerver. Et c'est assez vite le cas sous Linux
depuis quelques noyaux, la valeur de vm.swapiness ne servant
quasiment plus à rien.
Le Sat, 6 Jun 2020 13:58:28 -0000 (UTC),
Yliur <yliur@free.fr> écrivait :
Le Sat, 06 Jun 2020 12:34:07 +0000, JKB a écrit :
Pour fixer les idées :
https://github.com/systemd/systemd/issues 1224 open, 5016 closed.
Sauf que dans la liste il y a des choses qui vont du bug à la demande
d'amélioration, en passant par des questions limite forum (du type "je
ne vois pas comment faire ça", sans que ça ait forcément (encore) été
trié comme demande d'amélioration)
Si on ne considère que l'étiquette "bug", on a ça : 89 open, 829
closed.
Il se peut qu'en réalité ce soit un peu plus, mais prendre le chiffre
brut sans même regarder ce qu'il y a dedans c'est de la mauvaise foi
quand même...
Même s'il n'y en a _que_ 1000, ça fait beaucoup pour un daemon qui
devrait être trivial et entièrement prouvé (parce que c'est tout
de même sur lui que repose la stabilité du système).
Soyons joueur...
Configuration : i7, 32 Go de mémoire. Heureusement qu'il y a 32
Go de mémoire parce que, je viens de vérifier, le processus de
PID 1 consomme 170,6 Mo de mémoire. Et il n'est même pas
verrouillé en mémoire !
Chez moi aussi, sauf que top dit ça :
VIRT : 175288 RES : 5292 %MEM : 0,0
Donc si je comprends bien, 170Mo de mémoire virtuelle mais seulement
5Mo de mémoire réservée. Ce qui peut aussi bien signifier que plein de
code est associé à la mémoire virtuelle du processus mais que ce n'est
pas forcément chargé en mémoire.
Ça veut surtout dire virtuelle et résidente à l'instant /t/.
Il y a 170 Mo de mémoire réservée quelque part (allocations
mémoire, bibliothèques partagées le cas échéant) qui consomment
des ressources.
Mais pourquoi le fait qu'un bout de code du système d'initialisation
qui ne sert jamais reste en mémoire est plus pertinent que pour
n'importe quel processus ?
Parce que init doit récupérer tout un tas de choses dont les
codes de retour de tous les processus sous peine d'avoir des
zombies. Pour mémoire, un zombie, c'est un processus dont le père
ou init n'est pas allé à l'enterrement. Si à chaque fois qu'un
processus lancé par init s'achève, que init est dans le swap et
que ton système va chercher les pages dans le swap pour
simplement lire la valeur de retour du fils, je pense que tu vas
assez rapidement t'énerver. Et c'est assez vite le cas sous Linux
depuis quelques noyaux, la valeur de vm.swapiness ne servant
quasiment plus à rien.
Le Sat, 6 Jun 2020 13:58:28 -0000 (UTC),
Yliur écrivait :Le Sat, 06 Jun 2020 12:34:07 +0000, JKB a écrit :Pour fixer les idées :
https://github.com/systemd/systemd/issues 1224 open, 5016 closed.
Sauf que dans la liste il y a des choses qui vont du bug à la demande
d'amélioration, en passant par des questions limite forum (du type "je
ne vois pas comment faire ça", sans que ça ait forcément (encore) été
trié comme demande d'amélioration)
Si on ne considère que l'étiquette "bug", on a ça : 89 open, 829
closed.
Il se peut qu'en réalité ce soit un peu plus, mais prendre le chiffre
brut sans même regarder ce qu'il y a dedans c'est de la mauvaise foi
quand même...
Même s'il n'y en a _que_ 1000, ça fait beaucoup pour un daemon qui
devrait être trivial et entièrement prouvé (parce que c'est tout
de même sur lui que repose la stabilité du système).
Soyons joueur...
Configuration : i7, 32 Go de mémoire. Heureusement qu'il y a 32
Go de mémoire parce que, je viens de vérifier, le processus de
PID 1 consomme 170,6 Mo de mémoire. Et il n'est même pas
verrouillé en mémoire !
Chez moi aussi, sauf que top dit ça :
VIRT : 175288 RES : 5292 %MEM : 0,0
Donc si je comprends bien, 170Mo de mémoire virtuelle mais seulement
5Mo de mémoire réservée. Ce qui peut aussi bien signifier que plein de
code est associé à la mémoire virtuelle du processus mais que ce n'est
pas forcément chargé en mémoire.
Ça veut surtout dire virtuelle et résidente à l'instant /t/.
Il y a 170 Mo de mémoire réservée quelque part (allocations
mémoire, bibliothèques partagées le cas échéant) qui consomment
des ressources.
Mais pourquoi le fait qu'un bout de code du système d'initialisation
qui ne sert jamais reste en mémoire est plus pertinent que pour
n'importe quel processus ?
Parce que init doit récupérer tout un tas de choses dont les
codes de retour de tous les processus sous peine d'avoir des
zombies. Pour mémoire, un zombie, c'est un processus dont le père
ou init n'est pas allé à l'enterrement. Si à chaque fois qu'un
processus lancé par init s'achève, que init est dans le swap et
que ton système va chercher les pages dans le swap pour
simplement lire la valeur de retour du fils, je pense que tu vas
assez rapidement t'énerver. Et c'est assez vite le cas sous Linux
depuis quelques noyaux, la valeur de vm.swapiness ne servant
quasiment plus à rien.
Tiens, dans les trucs complexes pas encore élucidé,
j'ai une réplication mariadb que systemd est infoutu de lancer
correctement parce qu'il y a un timeout qui traîne et que je n'ai
pas encore identifié. Systemd dans sa grande bonté lance tout en
même temps,
sauf que le master mariadb est sur un vpn à l'autre bout de la
France... Le temps d'établir le VPN, systemd tue mariadb sur le
slave parce qu'il considère qu'il n'a pas démarré assez vite.
Désopilant !
Sauf qu'un merde de type systemd à récupérer sur 4000 caisses
enregistreuses Toshiba sur l'ensemble de la France, ça coule une
boîte un peu fragile. Mais il y a effectivement plein d'autres
raisons de planter une boîte.
Tiens, dans les trucs complexes pas encore élucidé,
j'ai une réplication mariadb que systemd est infoutu de lancer
correctement parce qu'il y a un timeout qui traîne et que je n'ai
pas encore identifié. Systemd dans sa grande bonté lance tout en
même temps,
sauf que le master mariadb est sur un vpn à l'autre bout de la
France... Le temps d'établir le VPN, systemd tue mariadb sur le
slave parce qu'il considère qu'il n'a pas démarré assez vite.
Désopilant !
Sauf qu'un merde de type systemd à récupérer sur 4000 caisses
enregistreuses Toshiba sur l'ensemble de la France, ça coule une
boîte un peu fragile. Mais il y a effectivement plein d'autres
raisons de planter une boîte.
Tiens, dans les trucs complexes pas encore élucidé,
j'ai une réplication mariadb que systemd est infoutu de lancer
correctement parce qu'il y a un timeout qui traîne et que je n'ai
pas encore identifié. Systemd dans sa grande bonté lance tout en
même temps,
sauf que le master mariadb est sur un vpn à l'autre bout de la
France... Le temps d'établir le VPN, systemd tue mariadb sur le
slave parce qu'il considère qu'il n'a pas démarré assez vite.
Désopilant !
Sauf qu'un merde de type systemd à récupérer sur 4000 caisses
enregistreuses Toshiba sur l'ensemble de la France, ça coule une
boîte un peu fragile. Mais il y a effectivement plein d'autres
raisons de planter une boîte.