2016-05-04 27 views

Odpowiedz

7

Zastosowanie Wikipedia API do tworzenia kwerendy z właściwością pageprops i resolving redirects:

https://en.wikipedia.org/w/api.php?action=query&prop=pageprops&ppprop=wikibase_item&redirects=1&titles=ARTICLE_NAME 

W twoim przypadku, na Wikipedii artykułów "Media w Karaczi" i "Media Pakistanu" dostaniesz ten sam identyfikator identyfikatora Wikidata: Q6805922. To samo dla "Karaachi" i "Karaczi"Q8660.

2

Oprócz zaakceptowanej odpowiedzi można również użyć interfejsu API Wikidata bezpośrednio w witrynie i tytule.

Docs są https://www.wikidata.org/w/api.php?action=help&modules=wbgetentities

Get podmiot dla http://en.wikipedia.org/wiki/Karachi:

+0

masz przykład problem rozwiązany przez ' normalizować parametr? – maxlath

+0

Tak, prostym przypadkiem byłyby tytuły = karachi nie zwróci wyniku, ponieważ tytuł ma być pisany wielkimi literami, normalize = 1 to naprawi. Zaktualizuję odpowiedź. – Addshore

1

Potrzebowałem zrobić to w G oogle Sheets, i był w stanie to zrobić za pomocą takiej formuły. Zakłada ona tytuł Wikipedia jest w kolumnie B. Kopiuj do wierszy trzeba

=IMPORTXML(concat("https://en.wikipedia.org/w/api.php?action=query&prop=pageprops&ppprop=wikibase_item&redirects=1&format=xml&titles=",B1),"//@wikibase_item") 

Kolejna propozycja jest użycie zrzut https://dumps.wikimedia.org/enwiki/latest/enwiki-latest-page_props.sql.gz, 230MB spakowane