OVH Cloud OVH Cloud

Comment supprimer des "quasi doublons" sans perte de données ?

3 réponses
Avatar
FabienGreppo
Bonjour à tous,

J'ai un fichier excel de +/- 35 000 lignes qui contient un grand nombre de quasi doublons.

Un fichier vaut mieux que 1000 mots, donc je vous mets une situation ci-dessous qui résume parfaitement les problématiques rencontrées. Il contient 5 lignes et j'aimerais en avoir 2 à la fin du dédoublonnage sans pour autant perdre d'informations.
https://drive.google.com/file/d/1NhC-x6yLIRo5HPZOn4LifAiHrie6o5GW/view?usp=sharing

Est-il possible de "e;rassembler"e; des lignes doublons par une sorte de concatener horizontal ?

J'espère que ma situation sera claire pour vous mais n'hésitez pas à revenir vers moi au besoin :).

Milles mercis,

Fabien

3 réponses

Avatar
fabiengreppo
Le lundi 22 Juin 2020 à 10:28 par FabienGreppo :
Bonjour à tous,
J'ai un fichier excel de +/- 35 000 lignes qui contient un grand nombre de
quasi doublons.
Un fichier vaut mieux que 1000 mots, donc je vous mets une situation ci-dessous
qui résume parfaitement les problématiques rencontrées. Il
contient 5 lignes et j'aimerais en avoir 2 à la fin du
dédoublonnage sans pour autant perdre d'informations.
https://drive.google.com/file/d/1NhC-x6yLIRo5HPZOn4LifAiHrie6o5GW/view?usp=sharing
Est-il possible de "e;rassembler"e; des lignes doublons par une sorte
de concatener horizontal ?
J'espère que ma situation sera claire pour vous mais n'hésitez
pas à revenir vers moi au besoin :).
Milles mercis,
Fabien
Mauvais lien, voici le bon ^^
https://docs.google.com/spreadsheets/d/1SRtDiZsYvyAjqGXPbJc3UG1mdSlvEPeyYHxoeTw1DAg/edit?usp=sharing
Avatar
MichD
Le 22/06/20 à 04:28, FabienGreppo a écrit :
Bonjour à tous,
J'ai un fichier excel de +/- 35 000 lignes qui contient un grand nombre de quasi
doublons.
Un fichier vaut mieux que 1000 mots, donc je vous mets une situation ci-dessous
qui résume parfaitement les problématiques rencontrées. Il contient 5 lignes et
j'aimerais en avoir 2 à la fin du dédoublonnage sans pour autant perdre
d'informations.
https://drive.google.com/file/d/1NhC-x6yLIRo5HPZOn4LifAiHrie6o5GW/view?usp=sharing
Est-il possible de "e;rassembler"e; des lignes doublons par une sorte de
concatener horizontal ?
J'espère que ma situation sera claire pour vous mais n'hésitez pas à revenir
vers moi au besoin :).
Milles mercis,
Fabien

Bonjour,
Ce qu'il manque à ta question,
Pour une adresse dans une ville particulière, quelles sont les colonnes
susceptibles d'avoir des données différentes dont tu veux concaténer et
ce, dans de maximiser l'efficacité et la rapidité du traitement contenu
de ton tableau de données, 35000 lignes par une vingtaine de colonnes?
MichD
Avatar
MichD
Le 22/06/20 à 05:49, MichD a écrit :
Le 22/06/20 à 04:28, FabienGreppo a écrit :
Bonjour à tous,
J'ai un fichier excel de +/- 35 000 lignes qui contient un grand
nombre de quasi
doublons.
Un fichier vaut mieux que 1000 mots, donc je vous mets une situation
ci-dessous
qui résume parfaitement les problématiques rencontrées. Il contient 5
lignes et
j'aimerais en avoir 2 à la fin du dédoublonnage sans pour autant perdre
d'informations.
https://drive.google.com/file/d/1NhC-x6yLIRo5HPZOn4LifAiHrie6o5GW/view?usp=sharing
Est-il possible de "e;rassembler"e; des lignes doublons par une sorte de
concatener horizontal ?
J'espère que ma situation sera claire pour vous mais n'hésitez pas à
revenir
vers moi au besoin :).
Milles mercis,
Fabien

Bonjour,
Ce qu'il manque à ta question,
Pour une adresse dans une ville particulière, quelles sont les colonnes
susceptibles d'avoir des données différentes dont tu veux concaténer et
ce, dans de maximiser l'efficacité et la rapidité du traitement contenu
de ton tableau de données, 35000 lignes par une vingtaine de colonnes?
MichD

J'ai noté que dans ton tableau, tu as ces 2 adresse situées dans la même
ville "Chirens". Est-ce vraiment des adresses différentes?
886 Route De Chartreuse et 886 Route De La Chartreuse
Si c'est la même adresse, comment dire à Excel que c'est la même chose?
Si tu as des erreurs de frappe ou des particules insérées en trop, il ne
faut pas demander à Excel de faire les corrections qui s'imposent!
MichD