关于使用openpyxl库,在单个单元格内无法完全将字符串插入的问题。
# 新建Excel文件,如果文件已经存在,则打开该文件
filename = "examplwe.xlsx"
print(filename)
if os.path.exists(filename):
wb = openpyxl.load_workbook(filename)
else:
wb = openpyxl.Workbook()
# 选择第一个工作表
worksheet = wb.active
#获取链接
hrefs = get_href_list(url)
wenben = urltaitou + hrefs[0]
all_text_str = get_all_text(wenben)
print(wenben,all_text_str)
worksheet.cell(1, 1, all_text_str)
# 保存文件
wb.save(filename)
代码如上,我要爬取某个网站的全部文本信息,由于网页文本较多,all_text_str字符串大概有15000个汉字,且由于某种原因,这些文本只能放置在一个单元格内(execl单元格完全可以放下那么多汉字),但是每次单元格内只能插入不到2000字,有时多有时少。
我在网上查了很久,没有相关信息。
我自己排查了很久,不知道问题出在哪里。
1、已排查获取的文本是否有特殊格式:没有特殊格式,全为汉字
2、是否是openpyxl库的问题:目前看来并不是,因为我也尝试了pandas 库,问题依旧
3、其他网页的文本是否可以全部置入单元格内:没有尝试过,但是应该不是,因为我尝试给字符串赋值全汉字,但是也无法全部放置进去
如上,请各位不吝赐教。谢谢了!