把爬取的数据放进mysql时提示“string index out of range ”

把爬取的数据放进mysql时提示“string index out of range，而且数据库里的公司名不全的状况
以下是代码

import requests
import re
import time
import numpy
import pymysql
import pandas
headers= {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36'}
company = ["腾讯","百度"]
page_num= 1
for i in range(len(company)):
    for j in range(page_num):
        url = 'https://a.jiemian.com/index.php?m=search&a=index&msg='+company[i]+'type=news&page='+str(j+1)
        res = requests.get(url,headers=headers).text
        comntent = res
        
        p_allnews = '<div class="news-view left">(.*?)</div></div></div>'
        result_all = re.findall(p_allnews,comntent,re.S)
        
        new_single=[]
        for l in range(len(result_all)):
            p_title = '<div class="news-header"><h3><a href=.*?target="_blank" title="(.*?)">'
            title = re.findall(p_title,result_all[l])
            if title ==[]:
                title.append("没有标题")

            p_s = '<span class="author"><a href=.*? target="_blank">(.*?)</a> '
            s = re.findall(p_s,result_all[l].strip(),re.S)
            if s ==[]:
                s.append("没有来源")

            p_dt = '<span class="date">(.*?)</span>'
            dt = re.findall(p_dt,result_all[l].strip(),re.S)
            if dt ==[]:
                dt.append("没有时间")


            p_c = '<div class="news-main"><p>(.*?)</p></div>'
            c = re.findall(p_c,result_all[l].strip(),re.S)
            if c ==[]:
                c.append("没有内容")

            print(str(l+1)+'.'+title[0])
            print("来源："+s[0]+"\n发布日期："+dt[0])
            print("新闻摘要："+c[0])
            
            company = company[i]
            title = title[0]
            s = s[0]
            dt = dt[0]
            c = c[0]
            
            db = pymysql.connect(host='localhost',port=3306,user='root',password='',database='jpnew',charset='utf8')
            cur = db.cursor()
            sql = "INSERT INTO `news` (`company`, `title`, `source`, `datatime`, `content`) VALUES (%s,%s,%s,%s,%s)"
            cur.execute(sql,(company,title,s,dt,c))
            db.commit()
            cur.close()
            db.close()

提示错误：string index out of range，而且数据库里的公司名不全的状况，为什么会出现这种情况，要怎么解决呢？

以下是数据库图片

展开全部

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
cjh4312 2023-03-28 00:47
关注
你的写法有些奇怪,再说用+串联效率是非常低的。

company = ["腾讯","百度"] page=3 for i in company: for j in range(1,page+1): url = f'https://a.jiemian.com/index.php?m=search&a=index&msg={i}type=news&page={j}'
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

编辑

预览

报告相同问题？

关注问题

python运行问题IndexError: tuple index out of range python 有问必答
2022-03-18 09:09

回答 3 已采纳 data1.append((start_num[i], end_num[i], data[i][75]))中data[i][75]是取每行的第76个字段, 你数据库中有76个字段吗没有就是tuple
mysql ：Parameter index out of range (2 > number of parameters, which is 1). java mysql
2021-09-28 09:25

回答 6 已采纳 query方法把order变量的sql给改了吧，后面用的order的时候就是改过的sql了。
安装MySQL时提示Mandatory MySQL Installer Upgrade Available mysql
2023-02-26 09:29

回答 2 已采纳该回答引用NewBing 你好，这是Bing。我可以帮你解决安装MySQL的问题。😊 根据网上的搜索结果①②，如果你在安装MySQL时提示Mandatory MySQL Installer Upg
面经-hangzhou
2022-07-08 12:27

云F的博客 Object类方法基本数据类型和包装类二、JVM篇 JVM内存划分 JVM类加载过程 JVM垃圾回收线上故障排查三、多线程篇线程调度线程池线程安全内存模型四、MySQL篇 WhyMysql？事务索引 SQL查询集群面试题线上...
如何把request爬取的数据弄到SQL server数据库里面(语言-python) python sqlserver
2022-04-18 02:01

回答 2 已采纳 1、清洗你爬取的数据，使其符合数据库中表对数据的规则要求；2、 import pymssql3、连接你的数据库，执行写入，如下：
c++向mysql插入string类数据出错 c++ mysql
2019-05-02 05:15

回答 1 已采纳这不是数据库的错误，字符串string 不是用%s, 你可以输出query 看看 sprintf_s(query, "insert into studentg(sno,sname) valu
java如何把MySQL中longblob数据转换成文件，越简单越好。 java mysql
2022-07-22 02:49

回答 1 已采纳从数据库读取值，然后用byte[]接收，最后使用字节流写入指定的文件
2022年Redis最新面试题
2022-04-19 00:48

漫步coding的博客 2022年Redis最新面试题一、Redis基础...二、数据结构1、Redis的数据类型有哪些？2、Hash如何实现O(1)的查询和设置速度, 以及扩容原理3、说说 Redis 哈希槽的概念？4、布隆过滤器三、事务1、怎么理解 Redis 事务？2、Re
MYSQL数据库字段用 varchar(20)数据类型，总是提示长度不够 mysql 有问必答
2021-05-24 16:32

回答 3 已采纳我找到问题了，原因是我一开始的 id_card 和 phone_number 字段用的是 int 类型创建的，然后我在后边没有用 alter 去修改数据类型，而是直接在上面创建语句上面去改……肯定没
navicat向mysql导入excel数据时候报错 mysql
2022-06-13 04:51

回答 2 已采纳如果空表导入也提示主键重复，说明你excel里的主键就重复excel导入之前先全选主键列，然后选择删除重复项，然后看哪一行变空白了
java.sql.SQLException: Parameter index out of range (1 > number of parameters, w
2011-03-12 06:39

回答 7 已采纳 [quote]PreparedStatement pst = cn .prepareStatement("select * from temp where na
Java复习面试题
2021-06-03 18:52

南伊_Angela的博客封装:隐藏部分对象的属性和实现细节,对数据的访问只能通过对外公开的接口,通过这种方式,对象对内部数据提供了不同级别的保护,以防止程序中无关的部分意外的改变或错误的使用了对象的私有部分多态:对于同一个行为,...
2021年我的java面试题
2021-08-06 15:07

别訆我小内脏的博客他在jdk1.7 和 jdk1.8 之间，他的实现策略有所不同，其中比较重要的两个区别就是数据结构和头插尾插在JDK1.7的时候，hashMap 采用的数据结构是数组加链表。但是到了JDK1.8 之后就是数组加链表加红黑树了。加入...
python 爬虫之路教程
2017-05-04 04:02

Android系统攻城狮的博客此时面对新的问题是数据之间的link越来越少比如淘宝点评这类数据彼此link很少那么抓全这些数据就很难还有一些数据是需要提交查询词才能获取比如机票查询那么需要寻找一些手段“发现”更多更完整的不是明面上的数据。...
[Python]新手写爬虫全过程（转）
2015-08-15 07:53

weixin_34129696的博客数据存放？这个是一个练手的玩具，就写在txt文本里吧。其实主要的不是学习爬虫，而是依照这个需求锻炼下自己的编程能力，最重要的是要有一个清晰的思路（我在以这个目标努力着）。ok，主旨已经订好了，开始‘...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月28日
展开全部

把爬取的数据放进mysql时提示“string index out of range ”

2条回答 默认 最新

问题事件

2条回答默认最新