Mam tabelę zawierającą> 1 mln wierszy danych i ponad 20 kolumn.Usuwanie zduplikowanych wierszy z tabeli BigQuery
W ramach mojej tabeli (tabela X) zidentyfikowałem zduplikowane rekordy (~ 80 tys.) W jednej konkretnej kolumnie (kolumna_adresów).
Jeśli to możliwe, chciałbym zachować oryginalną nazwę tabeli i usunąć duplikaty rekordów z mojej problematycznej kolumny, w przeciwnym razie mógłbym utworzyć nową tabelę (tableXfinal) z tym samym schematem, ale bez duplikatów.
Nie jestem biegły w SQL lub innym języku programowania, więc proszę wybaczyć moją niewiedzę.
delete from Accidents.CleanedFilledCombined
where Fixed_Accident_Index
in(select Fixed_Accident_Index from Accidents.CleanedFilledCombined
group by Fixed_Accident_Index
having count(Fixed_Accident_Index) >1);
Właśnie przeczytałem, że tabele BigQuery są dołączane tylko dlatego, że potrzebuję zrobić kopię mojego stołu, więc! – TheGoat