2010-02-11 3 views
8

Od następujący kod HTML:Pierwsze pewną wartość atrybutu za pomocą XPath

<link rel="index" href="/index.php" /> 
<link rel="contents" href="/getdata.php" /> 
<link rel="copyright" href="/blabla.php" /> 
<link rel="shortcut icon" href="/img/all/favicon.ico" /> 

Próbuję uzyskać wartość href znacznika link o wartości rel = "shortcut icon", staram się to osiągnąć za pomocą XPath .

Jak to zrobić w Pythonie?

Odpowiedz

15

Jak to:

data = """<link rel="index" href="/index.php" /> 
<link rel="contents" href="/getdata.php" /> 
<link rel="copyright" href="/blabla.php" /> 
<link rel="shortcut icon" href="/img/all/favicon.ico" /> 
""" 

from lxml import etree 

d = etree.HTML(data) 

d.xpath('//link[@rel="shortcut icon"]/@href') 
['/img/all/favicon.ico']