遇到关于''.join吃字符串的问题

import requests
from lxml import etree
from urllib.parse import urljoin
import queue
# import threading
# import time


new_headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36"
               }
url = 'http://www.biqugev.com/book/40234/'

r = requests.get(url, headers=new_headers)
r.encoding = r.apparent_encoding

html = etree.HTML(r.text)
b = html.xpath("//div[@class='listmain']/dl/dd/a/@href")
b = [urljoin(url,i) for i in b]


q = queue.Queue()
for num in range(len(b)):
    qa = dict()
    qa['n'] = num
    qa['url'] = b[num]
    q.put(qa)


def parse_text(n, url):
    # print(n)
    r = requests.get(url,headers=new_headers)
    # print(r.status_code,r.encoding)
    html = etree.HTML(r.text)
    bb = html.xpath("//div[@class='content']/h1/text()")[0]
    aa = html.xpath("//div[@class='content']/div[@id='content']/text()")
    print(aa)
    # print(bb)
    aa = ''.join(aa)
    print('合起来:', aa)
    # time.sleep(1)

d = q.get()

parse_text(d['n'],d['url'])

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
咕泡-三木 2021-07-24 14:51
关注
加一行代码
print(len(aa))
可以看到，aa的长度很长，由此可以判断没有发送你所说的”吃字符串“的问题

在加一行代码

repr(aa)

可以看到字符中有大量的特殊符号，导致部分内容显式不出来
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Python字符串join（）方法
2020-07-11 01:14

cunchi4221的博客 Python string join() method creates a string from an iterable. It joins all the iterable ... Python字符串join（）方法从可迭代对象创建一个字符串。它将所有可迭代的元素与字符串作为分隔符相连并返回它...
Python字符串拼接利器：join()方法详解
2025-04-08 16:27

达不溜先生 ୧⍢⃝୨的博客在 Python 里，join() 是字符串对象的一个方法，其用途是把。每次操作创建新对象（时间复杂度O(n²)）：处理大规模数据时，时间复杂度为O(n)要求可迭代对象中的元素必须是字符串类型。在Python字符串操作中，：避免...
python的字符串方法join()
2024-09-30 17:19

学习指北的博客在 Python 中，join()方法是一个字符串方法，用于将字符串序列连接成一个单一字符串。它常用于将列表或元组中的字符串连接成一个字符串，并在每个元素之间插入指定的分隔符。
python 路径拼接字符串_浅谈python中拼接路径os.path.join斜杠的问题 python 对反斜杠的处理问题...
2021-03-17 12:11

陆zz的博客 os.path.join('d:/MyProgram','test')得到的结果是 'd:/MyProgram\\可以用函数os.path.normpath()保持一致Python 字符串使用r开头，反斜杠防止转义，但是如比如有个变量name="package，我的字符串如果不使用r的话是...
python 字符串的join方法
2022-10-26 14:55

Black_Friend的博客 join
python字符串的join方法_使用python中join()函数实现字符串拼接的方法
2021-02-10 07:21

lem0nster的博客使用python中join()函数实现字符串拼接的方法发布时间：2020-12-14 09:05:37来源：亿速云阅读：87作者：小新小编给大家分享一下使用python中join()函数实现字符串拼接的方法，希望大家阅读完这篇文章后大所收获，...
Python 字符串的join方法
2020-03-07 01:05

晚风_END的博客标题 字符串操作中的join方法通常，我们拿到一个字符串后，需要对字符串进行处理加工，也就是说数据的清洗后，我们才可以使用，常用的字符串操作广泛应用在网络爬虫以及web应用开发中，以及服务器运维等方方面面。...
【python基础】python中常用字符串函数详解
2021-10-31 11:04

非晚非晚的博客 1 字符串查询（index，find）2. 字符串大小写转换操作（upper、lower、swapcase、capitalize和title）3. 字符串对齐（center，just和zfill）4. 分割字符串(split、splitlines和partition)5. 合并与替换(join，...
python中字符串拼接join
2019-09-23 19:46

灞波儿渀的博客 python中字符串处理函数有"str".join(seq)，拼接字符串，和os.path.join()返回拼接后的字符串。一、"str".join(sequenue)，join函数 python下拼接字符串可通过join函数实现，使用方法： string.join(sequence) ...
.join()方法python_Python join()方法
2021-03-18 12:37

Yu-De~~~的博客描述Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。语法join()方法语法：str.join(sequence)参数sequence -- 要连接的元素序列。返回值返回通过指定字符连接序列中元素后生成的新字符串...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月24日

遇到关于''.join吃字符串的问题

2条回答 默认 最新

问题事件

2条回答默认最新