在对dataframe进行concat合并的时候,df_A有数据,df_B是从数据库表中查询到的空df。concat以后,原来df_A中的int64字段变成了object。
由此带来了一系列诡异的错误:
对df进行groupby mean 求均值报错,对列进行数值计算时速度奇慢无比。其它致命的错误还有没有暂时未知。
请问这个应当如何解决?
dataframe中object 与int64之间的转换过程很迷惑,求解?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- 搞IT的小李 2022-12-25 13:35关注
这可能是因为df_B中的int64字段的数据类型为null,所以在进行合并的时候会将int64字段的数据类型转换为object。
可以在查询数据库表时将空值设置为0,这样就可以保证df_B中int64字段的数据类型不会变化,避免在concat合并时出现数据类型变化的问题。
例如,在查询数据库表时可以使用如下语句:
SELECT COALESCE(int64_field, 0) AS int64_field FROM table_name
这样,当int64_field为空时,会将它设置为0,避免出现null值。
在pandas中,object类型表示的是字符串类型,而int64类型表示的是整数类型。转换过程中,需要将object类型的数据转换成int64类型的数据。
首先,需要确保object类型的数据中只包含整数。如果存在字符串或其他类型的数据,则转换可能会出错。
然后,可以使用pandas的astype()函数来进行转换。例如:
df['column_name'] = df['column_name'].astype(int)
这样就可以将df中的column_name列从object类型转换成int64类型。
注意,如果在转换过程中出现了错误,可以使用pandas的to_numeric()函数来解决。例如:
df['column_name'] = pd.to_numeric(df['column_name'], errors='coerce')
这样,就可以将df中的column_name列转换成int64类型,并且在转换过程中出现的错误会被忽略。
总之,在pandas中,object类型与int64类型之间的转换可以通过astype()函数或to_numeric()函数实现。在转换过程中,要注意数据的类型是否正确,以免出现错误。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报 编辑记录
悬赏问题
- ¥20 wireshark抓不到vlan
- ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
- ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
- ¥15 stata安慰剂检验作图但是真实值不出现在图上
- ¥15 c程序不知道为什么得不到结果
- ¥40 复杂的限制性的商函数处理
- ¥15 程序不包含适用于入口点的静态Main方法
- ¥15 素材场景中光线烘焙后灯光失效
- ¥15 请教一下各位,为什么我这个没有实现模拟点击
- ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来