怎样用python遍历表格中的内容

建设单位	项目名称	发文号	立案号	详情
中铁十六局集团有限公司	关于中铁十六局集团有限公司朝阳区青年路10号院项目2#住宅楼建设工程规划许可证延期的申请	2017规（朝）延字0001号	2017分延字0001	详情
北京博达顺源天然气有限公司	压缩天然气（CNG）加气母站	2017规函复市政字0002号	2017函市政字0001	详情
北京市平谷区教育委员会北京市平谷区大华山镇大华山村经济合作社	教学楼、风雨操场及食堂	2017规（平）乡临建字0001号	2017分乡建字0001	详情
李甫全	翻改建住房（灰瓦1）	2017规（西）条居字0001号	2017分条居字0001	详情
北京市花木有限公司	上水工程	2017规建市政否字0025号	2017市政建字0001	详情
北京地铁十六号线投资有限责任公司	北京地铁十六号线工程区间工程月坛南街站、阜外大街~月坛南街区间	2017规延市政字0004号	2017延市政字0001	详情
北京恒城投资发展集团有限公司	人才公租房项目		2017分复字0001	详情
北京房地集团有限公司	和平街十四区简易住宅楼改造项目	2017规（朝）选字0002号	2017分选字0001	详情
北京市环亚创业生物工程技术有限责任公司	工业用房		2017分监字0001	详情
北京公共交通控股（集团）有限公司		2017规竣市政字0001号	2017监市政字0001	详情

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

一直在路上的十安 2017-11-15 01:56

关注

这是之前写的一个很简单的解析表格的，就是利用普通的遍历。

 #!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@Time    : 4/10/17
@File    : normalForm.py
@Remark  : 普通表解析
"""

class normalForm(object):
    """
    :param: response
    """

    def __init__(self):
        self.item_dict = {
            u"建设单位": "construction_unit",
            u"项目名称": "project_name",
            u"发文号": "issued_number",
            u"立案号": "case_number",
        }

    def parser_item(self, response, table_xpath):
        # 第一行为表头时，匹配表头从第二行开始
        tr_first = 2
        items_list = list()
        trs = response.xpath("{}//tr".format(table_xpath)).extract()
        for r in xrange(tr_first, len(trs) + 1):
            items = list()
            tds = response.xpath("{}//tr[{}]//td".format(table_xpath, r)).extract()
            for d in xrange(1, len(tds) + 1):
                shi_key = ''.join(response.xpath("{}//tr[{}]//td[{}]//text()".format(table_xpath, tr_first - 1, d)).extract()).replace(u'\xa0', '').replace(u'\r', '').replace(u'\t', '').replace(u'\n', '').replace(u' ', '')
                shi_value = ''.join(response.xpath("{}//tr[{}]//td[{}]//text()".format(table_xpath, r, d)).extract()).replace(u'\xa0', '').replace(u'\r', '').replace(u'\t', '').replace(u'\n', '').replace(u' ', '')
                if shi_key in self.item_dict and shi_value != '':
                    # print shi_key, '^^^^^^', shi_value
                    items.append({self.item_dict[shi_key]: shi_value})
            if len(items) > 0:
                items_list.append(items)
        return items_list

if __name__ == '__main__':
    pass
    # response = xxx  # 此处xxx为你的网页response
    # table_xpath = "/table"
    # normalForm().parser_item(response, table_xpath)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

怎样用python遍历表格中的内容 python
2017-11-14 10:44

回答 1 已采纳这是之前写的一个很简单的解析表格的，就是利用普通的遍历。 ``` #!/usr/bin/env python # -*- coding: utf-8 -*- """ @Time
python使用python-docx模块读取word表格发生重复 python
2021-03-05 23:08

回答 4 已采纳遍历的时候有意识去重就可以了 value_list = list() for row in table.rows: temp = list() for cell in row.ce
python 如何按照word顺序遍历每一段落（包括段落的自动编号）和每一个表格 python 有问必答
2022-02-22 11:49

回答 3 已采纳使用docx读取段落自动编号比较麻烦，可以用另一个库docx2python，读取成列表,分级编号无论是数字还是字母都能读取出来 from docx2python import docx2python
python遍历文件夹下所有excel文件
2020-12-23 17:30

大数据处理经常要用到一堆表格，然后需要把数据导入一个list中进行各种算法分析，简单讲一下自己的做法： 1.如何读取excel文件网上的版本很多，在xlrd模块基础上，找到一些源码： import xdrlib ,sys import ...
python-docx 库自动根据工序数量依次在word表格内填充内容 python
2022-03-10 08:18

回答 4 已采纳我猜题主的意思是每个工序填充两列，下一个工序接着当前工序填充，我这里写了一个Demo，你看看是不是你的意思： from docx import Document document = Docume
用python读取多个csv表指定数据写入一个表中 python 有问必答
2022-01-24 01:28

回答 8 已采纳 import pandas as pd import glob import os # 获取当前路径 cwd = os.getcwd() # 要拼接的文件夹及其完整路径，注不要包含中文 ## 待读
程序在导入excel表数据进行遍历过程中，运算比较慢，我想在这之间现实进度条怎么实现？ python
2022-01-07 19:55

回答 1 已采纳这个得看你用什么做界面，可以考虑用 pubsub 来和界面做通讯。就是界面有个方法画进度条，你的遍历过程代码，用pubsub 发消息给界面里的画进度条的方法。 W
chatgpt赋能python：Python中的表格遍历方法
2023-06-18 06:15

洛蕾的博客表格是将数据组织在行和列中的数据结构。每一行包含一个记录，每一列包含相同的类型数据。表格通常用于存储和管理大量的数据。姓名年龄城市张三18北京李四20上海王五22广州赵六24杭州本文由chatgpt生成，文章没有在...
python通过xlwings操作excel速度慢问题 python 有问必答
2022-03-30 18:54

回答 2 已采纳建议你第一次读取把数据存入列表，然后用一个创建一个迭代器对象进行循环删除，再重新写入，第一次循环完了列表多余项删除，然后再用新条件写入第二个表格，可以一行一行用offset写入。用time模块测一下看
csv中如果前两列数字相同则第三列数相加 python
2022-04-14 15:59

回答 3 已采纳 df=pd.DataFrame({'a':[1,2,3,1],'b':[1,3,5,1],'c':[2,4,6,1]}) df=df.groupby(['a','b']).sum().reset_i
将excel表中的偶数行，奇数列提取出来成为一个新的表 python
2022-03-17 14:38

回答 1 已采纳 import pandas as pd #提取 excel 中的偶数行数据 df = pd.read_excel(r'C:/Users/Admin/Desktop/results.xlsx',sk
python遍历excel
2023-02-10 09:32

技术小强1573的博客 Python, excel, xls, xlrd, 遍历
python web前端如何实现网格视图遍历数据库，可以给个大概前端代码吗？ flask mysql python 有问必答
2021-06-04 13:34

回答 3 已采纳您好，我是有问必答小助手，您的问题已经有小伙伴解答了，您看下是否解决，可以追评进行沟通哦~ 如果有您比较满意的答案 / 帮您提供解决思路的答案，可以点击【采纳】按钮，给回答的小伙伴一些鼓励哦～～
python如何遍历文件内容_如何遍历python docx文档中的所有内容？
2020-12-29 11:31

蛋丁蛋丝的博客第一个是按文档顺序遍历文档中的所有块级元素。第二步是按块元素出现的顺序遍历每个块元素中的所有内联元素。我知道没有确切的对应项来处理内联项，但我希望您可以在paragraph.runs中取得相当大的进展。所有内联内容...
pythonexcel汇总_用python汇总excel表格数据-怎样用python遍历表格中的内容
2020-11-24 06:34

weixin_39797381的博客如何用python将数据写入excel表格#需xlrd-0.9.2xlutils-1.7.1这两个模块fromxlwtimportWorkbook,Formulaimportxlrdbook=Workbook()sheet1=book.add_sheet('Sheet1')sheet1.write(0,0,10)sheet1.write(0,1,20)sheet1....
没有解决我的问题, 去提问

悬赏问题

¥15 树莓派与pix飞控通信
¥15 自动转发微信群信息到另外一个微信群
¥15 outlook无法配置成功
¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题

码龄粉丝数原力等级 --

怎样用python遍历表格中的内容

1条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

怎样用python遍历表格中的内容

1条回答 默认 最新

悬赏问题

1条回答默认最新