Mam niektóre HTML, który wygląda tak:Get tekst bezpośrednio wewnątrz znacznika w Nokogiri
<dt>
<a href="#">Hello</a>
(2009)
</dt>
mam już całe HTML załadowanej do zmiennej o nazwie record
. Muszę przeanalizować rok, czyli rok 2009, jeśli istnieje.
Jak mogę uzyskać tekst wewnątrz znacznika dt
, ale nie tekst wewnątrz znacznika a
? Użyłem record.search("dt").inner_text
i to daje mi wszystko.
To banalne pytanie, ale nie udało mi się tego rozgryźć.
Należy również zauważyć, że nie są w rzeczywistości dwoma węzłami tekst wewnątrz tego 'dt' (chyba, że przeanalizował HTML za pomocą opcji 'noblanks'): pierwszy węzeł tekstowy to' '\ n" 'przed' ', a drugim węzłem tekstowym jest' "\ n (2009) \ n" "po nim. – Phrogz