初涉Scrapy,还在摸索语法,标题所示的问题是我遇到的比较棘手的问题,还在做进一步搜索,还请各路好汉不吝赐教。
最终达到的效果应该像BeautifulSoup框架里bs4.element.Tag中contents属性一样,能让我方便对每一个元素或文本进行筛选。
初涉Scrapy,还在摸索语法,标题所示的问题是我遇到的比较棘手的问题,还在做进一步搜索,还请各路好汉不吝赐教。
最终达到的效果应该像BeautifulSoup框架里bs4.element.Tag中contents属性一样,能让我方便对每一个元素或文本进行筛选。
def pares(self,response):
print(response.body_as_unicode())
#### response.body_as_unicode()就是html,你直接用BeautifulSoup解析就行
soup = BeautifulSoup( response.body_as_unicode(),"lxml")
#### 这样就转换成你擅长的东西了