在对dataframe进行concat合并的时候,df_A有数据,df_B是从数据库表中查询到的空df。concat以后,原来df_A中的int64字段变成了object。
由此带来了一系列诡异的错误:
对df进行groupby mean 求均值报错,对列进行数值计算时速度奇慢无比。其它致命的错误还有没有暂时未知。
请问这个应当如何解决?
dataframe中object 与int64之间的转换过程很迷惑,求解?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- 搞IT的小李 2022-12-25 13:35关注
这可能是因为df_B中的int64字段的数据类型为null,所以在进行合并的时候会将int64字段的数据类型转换为object。
可以在查询数据库表时将空值设置为0,这样就可以保证df_B中int64字段的数据类型不会变化,避免在concat合并时出现数据类型变化的问题。
例如,在查询数据库表时可以使用如下语句:
SELECT COALESCE(int64_field, 0) AS int64_field FROM table_name
这样,当int64_field为空时,会将它设置为0,避免出现null值。
在pandas中,object类型表示的是字符串类型,而int64类型表示的是整数类型。转换过程中,需要将object类型的数据转换成int64类型的数据。
首先,需要确保object类型的数据中只包含整数。如果存在字符串或其他类型的数据,则转换可能会出错。
然后,可以使用pandas的astype()函数来进行转换。例如:
df['column_name'] = df['column_name'].astype(int)
这样就可以将df中的column_name列从object类型转换成int64类型。
注意,如果在转换过程中出现了错误,可以使用pandas的to_numeric()函数来解决。例如:
df['column_name'] = pd.to_numeric(df['column_name'], errors='coerce')
这样,就可以将df中的column_name列转换成int64类型,并且在转换过程中出现的错误会被忽略。
总之,在pandas中,object类型与int64类型之间的转换可以通过astype()函数或to_numeric()函数实现。在转换过程中,要注意数据的类型是否正确,以免出现错误。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报 编辑记录
悬赏问题
- ¥15 乌班图ip地址配置及远程SSH
- ¥15 怎么让点阵屏显示静态爱心,用keiluVision5写出让点阵屏显示静态爱心的代码,越快越好
- ¥15 PSPICE制作一个加法器
- ¥15 javaweb项目无法正常跳转
- ¥15 VMBox虚拟机无法访问
- ¥15 skd显示找不到头文件
- ¥15 机器视觉中图片中长度与真实长度的关系
- ¥15 fastreport table 怎么只让每页的最下面和最顶部有横线
- ¥15 java 的protected权限 ,问题在注释里
- ¥15 这个是哪里有问题啊?