1 百度文库中的文本内容有两种标签,该如何用一行代码将他爬下来呢?例如:
xt=driver.find_elements_by_class_name("reader-word-layer")#爬取文章内容
for i in xt:
print(i.text)
能不能在第一行代码的的括号里写两个标签呢?
2 爬下来的内容都是一段一段散着的,有什么办法让他们连起来呢?
1 百度文库中的文本内容有两种标签,该如何用一行代码将他爬下来呢?例如:
xt=driver.find_elements_by_class_name("reader-word-layer")#爬取文章内容
for i in xt:
print(i.text)
能不能在第一行代码的的括号里写两个标签呢?
2 爬下来的内容都是一段一段散着的,有什么办法让他们连起来呢?
用CSS选择器,符合“,”代表或者,可以选中两种class的元素。
连接内容,join列表就可以了