Mam uruchomione zadanie w trybie pseudo-rozproszonym na moim 4 rdzeniowym laptopie. Jak mogę zapewnić efektywne wykorzystanie wszystkich rdzeni? Obecnie mój program do śledzenia zadań pokazuje, że tylko jedno zadanie jest wykonywane jednocześnie. Czy to oznacza, że używany jest tylko jeden rdzeń?Pełne wykorzystanie wszystkich rdzeni w trybie pseudo-rozproszonym Hadoop
Poniżej znajdują się moje pliki konfiguracyjne.
conf/rdzenia site.xml:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
conf/HDFS-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
Edycja : Zgodnie z odpowiedzią, muszę dodać następujące właściwości w pliku mapred-site.xml
<property>
<name>mapred.map.tasks</name>
<value>4</value>
</property>
<property>
<name>mapred.reduce.tasks</name>
<value>4</value>
</property>
mapred.map.tasks i mapred.reduce.tasks nie kontrolują # mapy/zmniejsz liczbę zadań na węzeł. Przed wyborem odpowiedzi proszę się upewnić. –
@Praveen to prawda, ale ponieważ ma 1 węzeł, będzie musiał przynajmniej zasugerować, aby używał więcej mapujących, a nie tylko podnosić maksimum na tracker. –
@Nemo Oprócz dodania wartości mapowanych. (Map | reduce) .tasks wynoszącej 4 w mapred-site.xml, zmieniłeś wartości mapreduce.tasktracker. (Map | reduce) .tasks.maximum, aby w pełni wykorzystywać wszystkie rdzenie? – AST