Po tej linii można uzyskać liczbę MAP_INPUT_RECORDS i REDUCE_OUTPUT_RECORDS (również MAP_OUTPUT_RECORDS), przez uzyskanie wartości tych liczników:
long map_input_records = job.getCounters()
.findCounter("org.apache.hadoop.mapreduce.Task$Counter","MAP_INPUT_RECORDS")
.getValue();
long map_output_records = job.getCounters()
.findCounter("org.apache.hadoop.mapreduce.Task$Counter","MAP_OUTPUT_RECORDS")
.getValue();
long reduce_input_records = job.getCounters()
.findCounter("org.apache.hadoop.mapreduce.Task$Counter","REDUCE_INPUT_RECORDS")
.getValue();
long reduce_output_records = job.getCounters()
.findCounter("org.apache.hadoop.mapreduce.Task$Counter","REDUCE_OUTPUT_RECORDS")
.getValue();
na czas potrzebny do uruchomienia zadania, ja nie wiem, czy istnieje inny sposób (łatwiej) niż ustawienie długiego zmiennej z obecny czas przed i po jego wykonaniu i uzyskaniu ich różnicy.