scrapy问题的收集归类整理,scrapy是一个python中一个非常经典也是功能非常强大的一个数据采集软件。
如果安装scrapy完整介绍。安装scrapy比较的复杂,组件太多了。下面详细的介绍一睛安装scrapy的步骤。包括的内容有:安装python,并验证 安装setuptools 安装Zope.Interface,并验证 安装Twisted 安装w3lib,并验证 安装libxml2,并验证 安装pyOpenSSL,并验证 安装Scrapy,最好是用pip installl scrapy
crapy的crawl提示错误no active project,Unknown command: crawl.很有可能是没有到项目的根目录下执行此命令。所以会有这个错误。
normalize-space()的功能是去掉前后的空格。xpath函数normalize-space的两种用法,第一种方法非常实用,第二种方法就比较少用了。
发现一个比较特别的问题;在scrapy中,要选取多个li下面的a的herf标签,可以一句完成。scrapy在多个li下选择所有a标签的href
scrapy在win的命令行里运行时编码问题会比较特殊,在遇到中文里,会有各种\"u\"形字符串,这个时候,scrapy抓取的数据在windows的命令提示符里,如果要打印出中文,需要“print str.encode(\'gbk\')”才能显示出正常的中文。