Cel: Próbuję uzyskać odpowiednią interpretację pysparku Apache-iskry w ramach mojego IDP Pycharm.pyspark ImportError: nie można zaimportować nazwy akumulatorów
Problem: Obecnie pojawia się następujący błąd:
ImportError: cannot import name accumulators
byłem następujące poniższym blogu mi pomóc w procesie. http://renien.github.io/blog/accessing-pyspark-pycharm/
Z uwagi na fakt, że mój kod wykorzystał wyjątkową ścieżkę, osobiście pozbyłem się tej próby: z wyjątkiem: tylko po to, aby zobaczyć, jaki dokładnie był błąd.
Wcześniej otrzymałem następujący błąd:
ImportError: No module named py4j.java_gateway
ta została ustalona po prostu przez wpisanie '$ sudo pip zainstalować py4j' w bash.
Moje kodu aktualnie wygląda następującym fragmencie:
import os
import sys
# Path for spark source folder
os.environ['SPARK_HOME']="[MY_HOME_DIR]/spark-1.2.0"
# Append pyspark to Python Path
sys.path.append("[MY_HOME_DIR]/spark-1.2.0/python/")
try:
from pyspark import SparkContext
print ("Successfully imported Spark Modules")
except ImportError as e:
print ("Can not import Spark Modules", e)
sys.exit(1)
moje pytania:
1. Co jest źródłem tego błędu? Jaka jest przyczyna? 2. W jaki sposób mogę rozwiązać problem, aby uruchomić program Pyspark w moim edytorze plików Pycharm.
UWAGA: Prąd tłumacza używam w pycharm jest Python 2.7.8 (~/Anaconda/bin/python)
Dzięki z wyprzedzeniem!
Don
Witaj. Dzięki za odpowiedzi. Kiedy skomentowałem, że to nie rozwiązało problemu. –
Myślę, że to może mieć coś wspólnego z wersją Java.Wersja Java, którą mam, to 1.8 i musi zostać obniżona do wersji 1.6.X, żeby to działało. Po prostu nie chcę tego zrobić. Zobacz http://stackoverflow.com/questions/23353477/trouble-installing-pyspark –
@ matt2000, komentowanie akumulatorów daje błąd runtime, gdy próbowałem z przykładowym programem (takim jak wordcount.py) –