Getting error in crawling web ghoul

Question

Getting error in crawling web ghoul

Hi, I tried to implement this in my code. But I get the following error: exceptions.NameError: global name 'Request' is not defined .

 from scrapy.spider import BaseSpider from scrapy.selector import HtmlXPathSelector from bs4 import BeautifulSoup class spider_aicte(BaseSpider): name = "Indian_Colleges" allowed_domains = ["http://www.domain.org"] start_urls = [ "http://www.domain.org/appwebsite.html", ] def parse(self, response): filename = response.url.split("/")[-2] soup = BeautifulSoup(response.body) for link in soup.find_all('a'): download_link = link.get('href') if '.pdf' in download_link: pdf_link = "http://www.domain.org" + download_link print pdf_link class FileSpider(BaseSpider): name = "fspider" allowed_domains = ["www.domain.org"] start_urls = [ pdf_link ] for url in pdf_link: yield Request(url, callback=self.save_pdf) def save_pdf(self, response): path = self.get_path(response.url) with open(path, "wb") as f: f.write(response.body)

+4

python web-crawler web-scraping scrapy scrapy-spider

user2253803 Apr 22 '13 at 5:12

source share

1 answer

alecxe · Accepted Answer · 2013-04-22T06:56:08+0000

You should import Request before using:

 from scrapy.http import Request

Or there is also an import “shortcut”:

 from scrapy import Request

Or, if you have an import scrapy line, use scrapy.Request .

Getting error in crawling web ghoul

More articles: