oldbee0925 2022-12-25 13:18 采纳率: 91.4%
浏览 60
已结题

dataframe中object 与int64之间的转换过程很迷惑,求解?

在对dataframe进行concat合并的时候,df_A有数据,df_B是从数据库表中查询到的空df。concat以后,原来df_A中的int64字段变成了object。
由此带来了一系列诡异的错误:
对df进行groupby mean 求均值报错,对列进行数值计算时速度奇慢无比。其它致命的错误还有没有暂时未知。
请问这个应当如何解决?

  • 写回答

2条回答 默认 最新

  • 搞IT的小李 2022-12-25 13:35
    关注

    这可能是因为df_B中的int64字段的数据类型为null,所以在进行合并的时候会将int64字段的数据类型转换为object。

    可以在查询数据库表时将空值设置为0,这样就可以保证df_B中int64字段的数据类型不会变化,避免在concat合并时出现数据类型变化的问题。

    例如,在查询数据库表时可以使用如下语句:

    SELECT COALESCE(int64_field, 0) AS int64_field FROM table_name

    这样,当int64_field为空时,会将它设置为0,避免出现null值。

    在pandas中,object类型表示的是字符串类型,而int64类型表示的是整数类型。转换过程中,需要将object类型的数据转换成int64类型的数据。

    首先,需要确保object类型的数据中只包含整数。如果存在字符串或其他类型的数据,则转换可能会出错。

    然后,可以使用pandas的astype()函数来进行转换。例如:

    df['column_name'] = df['column_name'].astype(int)
    
    

    这样就可以将df中的column_name列从object类型转换成int64类型。

    注意,如果在转换过程中出现了错误,可以使用pandas的to_numeric()函数来解决。例如:

    df['column_name'] = pd.to_numeric(df['column_name'], errors='coerce')
    
    

    这样,就可以将df中的column_name列转换成int64类型,并且在转换过程中出现的错误会被忽略。

    总之,在pandas中,object类型与int64类型之间的转换可以通过astype()函数或to_numeric()函数实现。在转换过程中,要注意数据的类型是否正确,以免出现错误。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 1月2日
  • 已采纳回答 12月25日
  • 创建了问题 12月25日

悬赏问题

  • ¥20 wireshark抓不到vlan
  • ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
  • ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
  • ¥15 stata安慰剂检验作图但是真实值不出现在图上
  • ¥15 c程序不知道为什么得不到结果
  • ¥40 复杂的限制性的商函数处理
  • ¥15 程序不包含适用于入口点的静态Main方法
  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来