Zmieniam mapę hadoopów - zmniejsz liczbę zadań, które obecnie kompilują i działają bez moich zmian. W ramach pracy będę teraz łączyć się z S3, aby dostarczyć plik. Opracowałem (bardzo prostą) klasę s3
Amazon S3 limit rozmiaru pliku ma być 5T według tego announcement, ale otrzymuję następujący błąd podczas przesyłania pliku 5G '/mahler%2Fparquet%2Fpageview%2Fall-2014-2000%2F_temporary%2F_attempt_201
Potrzebuję dowiedzieć się między API Java Java SDK i Jets3t API? co jest lepsze pod względem przepustowości i wydajności? Zakładam, że połączenie nie jest niezawodne, więc może trzeba będzie przesłać/