oldbee0925 2022-12-25 13:18 采纳率: 91.4%
浏览 60
已结题

dataframe中object 与int64之间的转换过程很迷惑,求解?

在对dataframe进行concat合并的时候,df_A有数据,df_B是从数据库表中查询到的空df。concat以后,原来df_A中的int64字段变成了object。
由此带来了一系列诡异的错误:
对df进行groupby mean 求均值报错,对列进行数值计算时速度奇慢无比。其它致命的错误还有没有暂时未知。
请问这个应当如何解决?

  • 写回答

2条回答 默认 最新

  • 搞IT的小李 2022-12-25 13:35
    关注

    这可能是因为df_B中的int64字段的数据类型为null,所以在进行合并的时候会将int64字段的数据类型转换为object。

    可以在查询数据库表时将空值设置为0,这样就可以保证df_B中int64字段的数据类型不会变化,避免在concat合并时出现数据类型变化的问题。

    例如,在查询数据库表时可以使用如下语句:

    SELECT COALESCE(int64_field, 0) AS int64_field FROM table_name

    这样,当int64_field为空时,会将它设置为0,避免出现null值。

    在pandas中,object类型表示的是字符串类型,而int64类型表示的是整数类型。转换过程中,需要将object类型的数据转换成int64类型的数据。

    首先,需要确保object类型的数据中只包含整数。如果存在字符串或其他类型的数据,则转换可能会出错。

    然后,可以使用pandas的astype()函数来进行转换。例如:

    df['column_name'] = df['column_name'].astype(int)
    
    

    这样就可以将df中的column_name列从object类型转换成int64类型。

    注意,如果在转换过程中出现了错误,可以使用pandas的to_numeric()函数来解决。例如:

    df['column_name'] = pd.to_numeric(df['column_name'], errors='coerce')
    
    

    这样,就可以将df中的column_name列转换成int64类型,并且在转换过程中出现的错误会被忽略。

    总之,在pandas中,object类型与int64类型之间的转换可以通过astype()函数或to_numeric()函数实现。在转换过程中,要注意数据的类型是否正确,以免出现错误。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 1月2日
  • 已采纳回答 12月25日
  • 创建了问题 12月25日

悬赏问题

  • ¥30 eclipse开启服务后,网页无法打开
  • ¥30 雷达辐射源信号参考模型
  • ¥15 html+css+js如何实现这样子的效果?
  • ¥15 STM32单片机自主设计
  • ¥15 如何在node.js中或者java中给wav格式的音频编码成sil格式呢
  • ¥15 不小心不正规的开发公司导致不给我们y码,
  • ¥15 我的代码无法在vc++中运行呀,错误很多
  • ¥50 求一个win系统下运行的可自动抓取arm64架构deb安装包和其依赖包的软件。
  • ¥60 fail to initialize keyboard hotkeys through kernel.0000000000
  • ¥30 ppOCRLabel导出识别结果失败