Techniki augmentacji danych dla małych zestawów danych obrazu?

Obecnie trenuję małe zestawy danych logo podobne do Flickrlogos-32 z głębokimi CNN. Do szkolenia większych sieci potrzebuję więcej zestawu danych, dzięki czemu wykorzystuję augmentację. Najlepsze, co teraz robię, to używanie transformacji afinicznych (cecha normalizacji, centrum cech, obrót, przesunięcie wysokości, poziome pionowe obrócenie). Ale w przypadku większych sieci potrzebuję więcej ulepszeń. Próbowałem przeszukać krajowe dane naukowe kaggle pod numerem forum, ale nie mogłem uzyskać dużej pomocy. Jest kod dla niektórych metod podanych here, ale nie jestem pewien, co może być przydatne. Jakie są inne (lub lepsze) techniki powiększania danych obrazu, które można zastosować do tego typu (lub w jakimkolwiek innym obrazie) zestawu danych innego niż transformacje afiniczne?Techniki augmentacji danych dla małych zestawów danych obrazu?

Źródło

2016-03-22 whitewalker

Dobrym podsumowanie można znaleźć here sekcja 1 na danych Powiększanie: tak mianowicie koziołki, losowych upraw i kolor drgania a także hałas oświetlenie:

Krizhevsky et al. zaproponował fantazyjne PCA podczas szkolenia słynnego Alex-Net w 2012 roku. Fancy PCA zmienia intensywność kanałów RGB w obrazach treningowych.

Można również rzucić okiem na wyzwanie Kaggle Galaxy Zoo: zwycięzcy napisali: very detailed blog post. Obejmuje ona tego samego rodzaju technik:

rotacji
tłumaczenia,
powiększenia
koziołki,
kolor perturbacji.

Jak stwierdzono, robią to również "w czasie rzeczywistym, tj. Podczas treningu".

Na przykład tutaj jest praktyczny Torch implementation przez Facebook (dla szkolenia ResNet).

Źródło

2016-03-23 19:06:08 deltheil

Zbierałem kilka technik augmentacji w my masters thesis, page 80. Obejmuje ono:

zoom,
Crop
odbija (poziomo/pionowo)
obrotów
skalowania
ścinania
zmiany kanału (RGB, HSV)
kontrast
hałas,
winietowanie

Źródło

2017-08-01 17:06:13

Techniki augmentacji danych dla małych zestawów danych obrazu?

Odpowiedz

Powiązane problemy