Załóżmy grupę punktów danych, takich jak jeden wykreślona tutaj (ten wykres nie jest specyficzne dla mojego problemu, ale po prostu użyte jako odpowiedni przykład):Grupa wykrywanie w danych ustawia
Sprawdzanie graf punktu rozproszenia wizualnie jest dość oczywiste, że punkty danych tworzą dwie "grupy", z pewnymi przypadkowymi punktami, które oczywiście nie należą do żadnej z nich.
Szukam algorytmu, który pozwoli mi:
- początek ze zbioru danych z dwóch lub większej liczby wymiarów.
- wykrywanie takich grup z zestawu danych bez wcześniejszej wiedzy na temat tego, ile (lub jeśli w ogóle) może tam być
- po wykryciu grup, "zapytaj" modelu grup, jeśli nowy punkt próbki wydaje się pasować do dowolna z grup