成功爬取网页url得到的结果变成单独字符串怎么办

我成功爬取网站url后，得到的结果不是一个字符串，url的每个字符都单独变成一个字符串了，我用for i in herf：得到的结果如下
/
t
j
g
b
/
2
0
g
x
/
1
9
7
8
0
.
h
t
m
l
以下是我写的程序
import re
import requests
from bs4 import BeautifulSoup

for page in range(0,10):

url = f"http://www.tjcn.org/tjgb/20gx/index_{page}.html"

if page == 0:
    url = "http://www.tjcn.org/tjgb/20gx/index.html"
print(url)

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36"}

response = requests.get(url, headers=headers)
response.encoding = response.apparent_encoding
html = response.text

soup = BeautifulSoup(html, "lxml")

content_all = soup.find_all("a")

for item in content_all:                    # soup匹配到的有多个数据，用for循环取出
    result = {
        'title': item.get_text(),     # 标签在<a>标签中，提取标签的正文用get_text()方法
        'link': item.get('href'),  # 链接在<a>标签的href中，提取标签中的href属性用get()方法，括号指定属性数据
    }
    result.get("title")
    

    
    if "百色" in str(result):   #记得在要检索的对象前加str，把它转成字符串穿，要不然无法搜索
    
        href = []               #如果不建立元组，则无法直接调用键值（尝试好多次了）
        href = result.get("link") #调用键“link”的值
        

        for i in href:
            print(i)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
鸡蛋酱$ 2021-07-24 11:58
关注
把最后的循环去掉直接print(href),因为href就是字符串，你的herf=result.get('link')结果是字符串，覆盖了上一句的href=[]

有用的话点一下采纳

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

截取字符串python python
2022-03-19 21:53

回答 1 已采纳 s1 = input() s2 = input() if len(s1)<len(s2): print(s2[len(s1):]) else: print(s1[len(s2):
如何利用python 按规则生成字符串 python
2022-04-01 14:40

回答 2 已采纳大概逻辑这样先计算 字符串长度，可以插入空格是长度 -1 用 from itertools import combinations 算出所有的组合遍历插入字符串 ，输出
怎么在python中用正则提取指定多个字符串？ python 正则表达式
2022-02-12 18:04

回答 1 已采纳题主朋友，我把两种方法都列举了，请参考 import re # 不用re的方法 def func(goal_list, set_names): string = str(goal_list
python爬取网页数据步骤,python爬虫爬取网页数据
2024-03-20 06:06

gk12336的博客大家好，本文将围绕利用python爬取简单网页数据步骤展开说明，如何利用python爬取网页内容是一个很多人都想弄明白的事情，想搞清楚python爬取网页数据步骤图解需要先了解以下几个事情。
python字符串p型编码 python
2022-05-11 20:38

回答 1 已采纳 import itertools as it s = '122344111' res = [str(len(list(v))) + i for i , v in it.groupby(s)] r
Python如何获取字符串的指定部分 python
2021-05-26 10:40

回答 4 已采纳 s = "X1000_1_2" print(s.rindex("_")) print(s[0: s.rindex("_")]) 获取最后一个字符下标从0开始截取
python怎么用循环删除字符串的某个字符 python
2022-04-29 13:16

回答 4 已采纳 import random right = 0 num = 1 W = ['play', 'guess', 'english'] repeat = 'yes' while num < len(W
python爬取网页数据步骤,python爬取网页详细教程
2023-12-30 07:43

2301_81895949的博客大家好，小编来为大家解答以下问题，利用python爬取简单网页数据步骤，怎么用python爬取网站上的数据，今天让我们一起来看看吧！下面就按这个路线逐一讲讲各部分的内容；HTTP协议是一个应用层面向对象协议，也叫超...
python里面url太长怎么办。 python
2022-07-04 00:17

回答 1 已采纳 字符串可以用\换行，但后面几行要顶格。否则会加进去空格或者制表符的： url = 'http://www.dffdasfkldsaf.com/dljflddjfkdf\ kdljfsjkfdshjkf
关于#python#的问题：检查字符串“Life is short.I use python”中是否包含字符串“python”，若包含则替换为“python”后输出新字符串，否则输出原字符串 python
2021-10-05 17:33

回答 2 已采纳 a='Life is short.I use python' if 'python' in a: print(a.replace('python','java')) else: pri
python执行cmd命令获取网络信息无法正确转换成字符串,并且报错 python
2022-08-22 17:29

回答 2 已采纳 r = os.popen(cmd) response = r.buffer.read().decode(encoding='utf-8')
python怎么爬取网页数据,python爬取网页数据步骤
2024-01-26 17:41

chatgpt001的博客大家好，小编为大家解答python爬取网页数据表格会超出索引的问题。很多人还不知道利用python爬取简单网页数据步骤，现在让我们一起来看看吧！下面就按这个路线逐一讲讲各部分的内容；HTTP协议是一个应用层面向对象...
python爬取网页的方法总结,python怎么爬取网页内容
2023-12-24 05:12

YYmmsss的博客这篇文章主要介绍了利用python爬取简单网页数据步骤，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获，下面让小编带着大家一起了解一下。下面就按这个路线逐一讲讲各部分的内容；HTTP...
Python爬取网页图片
2020-07-15 01:06

Lotay_天天的博客 Python爬取网页图片一、爬取的网站内容爬取http://www.win4000.com/meinvtag26_1.html的COS图片这个网页相当于一个相册，每一个相册内有6-9张高清大图，每个相册都有自己单独的名字二、爬取的网站域名 win4000...
Python爬虫—爬取网页视频
2021-04-29 02:27

Zyer coder的博客 content = re.findall(model,res.text) #用于收集ts链接的列表 list = [] #单独提出key加到第一项 url_i = re.findall(model_key,res_content[0]) #''.join(对象)将元组,列表,转成字符串 url_i = ''.join(url_i) ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月24日

悬赏问题

¥15 51寻迹小车定点寻迹
¥15 谁能帮我看看这拒稿理由啥意思啊阿啊
¥15 关于vue2中methods使用call修改this指向的问题
¥15 idea自动补全键位冲突
¥15 请教一下写代码，代码好难
¥15 iis10中如何阻止别人网站重定向到我的网站
¥15 滑块验证码移动速度不一致问题
¥15 Utunbu中vscode下cern root工作台中写的程序root的头文件无法包含
¥15 麒麟V10桌面版SP1如何配置bonding
¥15 Marscode IDE 如何预览新建的 HTML 文件

成功爬取网页url得到的结果变成单独字符串怎么办

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新