Extrayendo artículos de la wikipedia
Martes, julio 15th, 2008Ando trasteando sobre como extraer información de diferentes fuentes y ahora quiero descargarme artículos de la wikipedia. Para descargarnos un artículo ejecutamos este script en python #!/usr/bin/python # El script es de http://www.rkblog.rk.edu.pl/w/p/25/ import sys from httplib import HTTPConnection from re import findall, DOTALL def wiki(slug): print(slug) #connect to a wikipedia (mediawiki) site (Spanish) conn = HTTPConnection("es.wikipedia.org") #get page by slug conn.request('GET', ...
