Import data depuis SQL : Suppression doublons
-
Import data depuis SQL : Suppression doublons
Bonjour, je récupère la BDD SQL country depuis powerBI et je dois supprimer les doublons. Je souhaite le faire dans SQL et je me demande quelle méthode est la plus pertinente ? :
-
Méthode 1 : pb = je supprime des données dans la BDD d’origine…
DELETE FROM country c1nINNER JOIN country c2ntON c1.country_name = c2.country_namentAND c1.capital_city = c2.capital_citynWHERE c1.id < c2.id ;
-
Méthode 2 : je crée une nouvelle table et je garde les données d’origine
CREATE TABLE new_country ASnSELECT DISTINCT country_name, capital_citynFROM country ;
Méthode 3 : création d’une table temporaire mais données non gardées en mémoire…
WITH country_tempnAS (n SELECT idn ROW_NUMBER() OVER(PARTITION BY country_name, capital_city) AS rownumn FROM countryn);
DELETE FROM countrynWHERE id IN (n SELECT id // sous-requête sélectionnant les enregistrements rownum >1n FROM country_tempn WHERE rownum >1n);
Peut être y a-t-il une autre méthode ? Merci d’avance !
PostID=i0Cf90Xqr6wwz82
-
Connectez-vous pour répondre.