Poszukuję optymalizacji następującego problemu (mam działający kod, ale jestem dość pewny, że może być szybszy i jest napisany w zły sposób) . Mam listę SKU (od 6 do 9 cyfr), na które szukam informacji w serwisie Amazon. Działający kod jest podany poniżej:Najbardziej efektywny sposób tworzenia słownika Python z listą

def buildDictionary2(stringy): 
    x = stringy.xpath('//sellersku/text()|//product/descendant::amount[1]/text()') 
    Sku_To_Price = {} 
    for items in range(len(x)): 
     if x[items] in myList: 
       if x[items+1] not in myList: 
        Sku_To_Price[x[items]] = x[items+1] 
        Sku_To_Price[x[items]] = '' 
    return Sku_To_Price 

gdzie x jest słownikiem generalnie zmiennych jednostek SKU i cen. Jednak komplikacja powoduje, że nie można znaleźć ceny. W tym przypadku lista (x) przechodzi do SKU, SKU zamiast do ceny SKU.

W tej chwili szukam na liście SKU (w zmiennej globalnej myList), ale nie mogę pomóc, to złożoność czasu O (e^n). Biorąc pod uwagę, że pracuję z czymś w regionie 20 000 SKU, wolałbym, żeby tak nie było.

Czy istnieje sposób, aby uczynić to mniej skomplikowanym - pożądane wyjście jest słownikiem z każdym SKU raz (jako klucz) i jest to cena odpowiednia jako wartość (bez wpisu, jeśli nie ma ceny).


próbkę XML przetwarzane

<?xml version="1.0" ?> 
<GetLowestOfferListingsForSKUResponse xmlns="http://mws.amazonservices.com/schema/Products/2011-10-01"> 
    <GetLowestOfferListingsForSKUResult SellerSKU="X" status="Success"> 
    <Product xmlns="http://mws.amazonservices.com/schema/Products/2011-10-01" 
    <GetLowestOfferListingsForSKUResult SellerSKU="X" status="X"> 
    <Product xmlns="http://mws.amazonservices.com/schema/Products/2011-10-01" 

i myList wygląda następująco:

myList = ['10032590', 

Korzystanie pierwsza odpowiedź poniżej Dostaję następujący komunikat o błędzie:

TypeError: unhashable type: 'list'

gdzie wierzę odpowiedniego kodu jest:

def xml_to_dict(self, xml): 
    doc = lh.fromstring(xml) 
    d = {} 
    for product in doc.xpath('.//product'): 
     sku = product.xpath('.//sellersku/text()') 
     amount = product.xpath('./descendant::amount[1]/text()') 
     d[sku] = amount 
    return d 

można dołączyć krótką próbkę SKU oraz cen? –


Również próbka analizowanego pliku XML byłaby pomocna, podejrzewam, że istnieją lepsze sposoby wyodrębniania jednostek SKU i cen, które mogą ułatwić to. –


'range (len (x))' jest zdecydowanie anty-idiomatyczny dla Pythona. Jeśli bezwzględnie musisz mieć indeksy i elementy numeryczne, użyj 'idx, item in enumerate (alist)'. –


for product in doc.xpath('.//product'): 
    sku = product.xpath('.//sellersku/text()')[0] 
    price = product.xpath('./descendant::amount[1]/text()') 
    if price: # if theres a possibility of sku missing replace with: 
       # "if price and sku" 
       # if you have duplicate sku's and you don't want them overwritten 
       # add "and sku not in d" check 
     d[sku]= price[0] 

Powiem tylko, że o tym nie zapomniałem/przestałem nad tym pracować. Teraz już działa. Aktualizuje po zakończeniu. –


@ Kali_89 - trzymajmy kciuki :) – root


Dzięki! To zadziałało, zajmuje około 1 godziny, aby wykonać 22 000 jednostek SKU, które uważam za całkiem dobre :) –