python将编号相同的一列按固定值拆分

问题遇到的现象和发生背景

希望将v这一列按照buck这一列进行拆分，同一个buck的量应该为326881602，拆分结果应该为标黄的vol这一列，如果buck的值相同，比如都为1，可以看到D2位置应该填326881602，如果buck都为3，那么对应的v这一列的值的和为326881602，也即D4+D5=326881602。

另外需要注意，对于新的一天，比如2020/1/3，9：31分的buck和2020/1/2的buck同为56，这就需要参考2020/1/2，14：57-15：00的v这一列，标黄的vol这一列是正确的结果，怎么才能得到

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

ENGineer_zlshuo 2022-05-07 16:11

关注

代码写长了一不小心，题主先试试行不行，数据格式没问题是前提，个别细节不懂可以留言

import pandas as pd

df = pd.read_csv('test.csv')
v_idx = list(df.columns).index('v')
df.insert(v_idx+1, column = 'vol', value = '')
b_idx = list(df.columns).index('buck')
df.loc[df['buck'].duplicated(keep = False) == False, 'vol'] = 326881602
df.loc[df['buck'].duplicated(keep = False) == True, 'vol'] = 0
v_set = list(set(df['v']))
b_set = list(set(df['buck']))


def v_checker():
    flag = 0
    for v in v_set:
        part = df.loc[df.v == v]
        check = 0
        for row in range(part.shape[0]):
            check += int(part.iloc[row, v_idx + 1])
        if check != int(v):
            flag += 1
        else:
            flag = flag
    if flag == 0:
        return True
    else:
        return False


def b_checker():
    flag = 0
    for b in b_set:
        part = df.loc[df.buck == b]
        check = 0
        for row in range(part.shape[0]):
            check += int(part.iloc[row, v_idx + 1])
        if check != 326881602:
            flag += 1
        else:
            flag = flag
    if flag == 0:
        return True
    else:
        return False


def v_correct():
    global df
    dfs = []
    for v in v_set:
        part = df.loc[df.v == v]
        check = 0
        for row in range(part.shape[0]):
            check += int(part.iloc[row, v_idx+1])
        if check != int(v):
            if check > int(v):
                over = check - int(v)
                max_row = part.shape[0]-1
                part.iloc[max_row, v_idx+1] -= over
                dfs.append(part)
            elif check < int(v):
                loss = int(v) - check
                min_row = part.shape[0]-1
                part.iloc[min_row, v_idx+1] += loss
                dfs.append(part)
        else:
            dfs.append(part)
    df = dfs[0]
    for index in range(1, len(dfs)):
        add = dfs[index]
        df = pd.concat([df, add])
        df.sort_index(ascending=True, inplace = True)


def b_correct():
    global df
    dfs = []
    for b in b_set:
        part = df.loc[df.buck == b]
        check = 0
        for row in range(part.shape[0]):
            check += int(part.iloc[row, v_idx+1])
        if check != 326881602:
            if check > 326881602:
                over = check - 326881602
                max_row = part.shape[0]-1
                part.iloc[max_row, v_idx+1] -= over
                dfs.append(part)
            elif check < 326881602:
                loss = 326881602 - check
                min_row = part.shape[0]-1
                part.iloc[min_row, v_idx+1] += loss
                dfs.append(part)
        else:
            dfs.append(part)
    df = dfs[0]
    for index in range(1, len(dfs)):
        add = dfs[index]
        df = pd.concat([df, add])
        df.sort_index(ascending=True, inplace = True)


def go():
    try:
        if v_checker() is False or b_checker() is False:
            v_correct()
            b_correct()
            go()
        else:
            df.to_csv('res.csv', index = False)  # 保存结果文件
    except:
        print('出问题了')


go()
print(df)
"""
实现的效果如下：
原数据
    date  time          v  buck
0      1    11  768944800     1
1      1    22  768944800     2
2      1    22  768944800     3
3      1    33  297902500     3
4      1    33  297902500     4
5      1    33  286462900     4
6      1    33  286462900     5
7      1    33  275848000     5
8      1    33  203289200     5
9      1    33  203289200     6
10     1    33  128842212     6

结果数据
    date  time          v        vol  buck
0      1    11  768944800  326881602     1
1      1    22  768944800  326881602     2
2      1    22  768944800  115181596     3
3      1    33  297902500  211700006     3
4      1    33  297902500   86202494     4
5      1    33  286462900  240679108     4
6      1    33  286462900   45783792     5
7      1    33  275848000  275848000     5
8      1    33  203289200    5249810     5
9      1    33  203289200  198039390     6
10     1    33  128842212  128842212     6
"""
"""

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

python将编号相同的一列按固定值拆分 python
2022-05-06 13:25

回答 2 已采纳代码写长了一不小心，题主先试试行不行，数据格式没问题是前提，个别细节不懂可以留言 import pandas as pd df = pd.read_csv('test.csv') v_idx = l
python两列数据以相同第一列合并问题 python
2022-08-06 13:44

回答 2 已采纳如果有编码问题改一下编码方案 with open('a.txt',encoding='utf-8') as f: p = f.readlines() res = {} for i in p:
python 表格中一列中的值怎么拆分 python
2022-01-18 11:54

回答 3 已采纳很多方法啊，正则表达式，datetime模块，都可以啊
Python实现拆分列至多行(一行代码)
2023-06-27 20:23

jogarys的博客需求是将每个id的value值展开至多行，刚开始我尝试硬写代码来实现拆分，结果发现代码很麻烦，而且数据量大是性能很差，其实可以使用dataframe自带的explode()函数来拆分，只需一行代码即可实现，且性能很好，实测约...
如何在python中将矩阵按列分割为数个矩阵 python
2021-03-23 21:41

回答 2 已采纳直接切片，或者用np.hsplit()函数，都可以吧。 >>> import numpy as np >>> a = np.random.random((5,2
python 如何将一维list 写入excel列 list python
2022-06-24 16:55

回答 3 已采纳 import pandas as pd list2 = ['我是子目录', '我是孙目录', '我是重孙目录'] df = pd.DataFrame(data = list2, columns =
用Python将一列分为多列 python
2021-09-25 13:30

回答 1 已采纳先用左括号（分割，再去除右括号
如何用python将一张excel表按某一列分类为多张表
2022-03-30 18:10

Gamers fei的博客如何用python将一张excel表按某一列分类为多张表
一个python读取csv文件对指定列求和问题 python 开发语言
2022-02-14 15:21

回答 5 已采纳 import pandas as pd df=pd.read_csv('d:/data/newly_confirmed_cases_daily.csv') num=df.Akita.sum() pr
python 查找字典里有相同值value的键key python
2022-05-07 18:32

回答 4 已采纳代码如下： dic = {10: False, 11: 8, 12: 7, 7: False, 8: 6, 9: 6,
python pandas筛选列数据拆分到多个sheet中怎么才能做到 python 有问必答
2021-12-25 20:59

回答 2 已采纳拆分到多个sheet; 使用Python一分钟完成按照某一列将Excel数据由一个sheet拆分为多个sheet（使用pandas超简单）_ccplus的博客-CSDN博
python按某列拆分excel表格_把一张Excel表按照固定列分成不同工作薄的小白方法...
2020-11-24 01:13

weixin_39541681的博客这是结合百度经验和论坛上的资料整理的...第一步将一个工作表按照某一列内容拆分为不同的工作表。用数据透视表的方法要数据比较少，上千条的数据基本上就运转不了。用Python的对知识要求有点高，舍弃；我用VBA的...
python如何删除excel某列中不含某些值所在的行 python
2022-03-16 11:18

回答 1 已采纳简单的方法就是，适合数据不多的情况用openpyxl库读入 excel2 到列表从尾部遍历excel1 ，发现包含关键字，用 delete_rows 方法删除
python按行拆分表格_Python将单元格中的多个值拆分为多行
2020-11-20 21:33

weixin_39533742的博客使用：#create dataframedf = pd.read_csv(filename, sep=';')#split all valuesdf = df.applymap(lambda x: x.split('|'))print (df)fruit_type fruit_color fruit_weight0 [Apple, Banan...
python中dataframe将一列中的数值拆分成多个列
2020-05-01 16:09

hcq15900382130的博客想将page_no这一列拆分成多个列，然后将其中的值都作为列名。想要做成的结果如下图（也就是统计每个id下各个page_no出现的次数）实现的思路是先对page_no这一列进行one-hot编码，将一列变为多列，然后再用...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月6日

悬赏问题

¥15 怎么生成确定数目的泊松点过程
¥15 python点云生成mesh精度不够怎么办
¥15 QT C++ 鼠标键盘通信
¥15 改进Yolov8时添加的注意力模块在task.py里检测不到
¥50 高维数据处理方法求指导
¥100 数字取证课程关于FAT文件系统的操作
¥15 如何使用js实现打印时每页设置统一的标题
¥15 安装TIA PortalV15.1报错
¥15 能把水桶搬到饮水机的机械设计
¥15 Android Studio中如何把H5逻辑放在Assets 文件夹中以实现将h5代码打包为apk

python将编号相同的一列按固定值拆分

问题遇到的现象和发生背景

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新