python的NUMBA装饰符、NUMPY自定义数据类型问题

  我的目的：因为要从数据库读写包含时间、字符的数据并快速分析处理，我想把结构化的包含时间、字符数据的numpy自定义类型数据放入用NUMBA装饰的python函数中计算。
  我的问题：进行了如下四种相关测试都报错

#####测试1,无法创建包含时间类型的NUMPY自定义数据类型
t1 = np.dtype([('age', int), ('date','datetime64')])
x = np.array([(1,''),(2,'2018-05-08')],dtype=t1)

###测试2，把包含时间数据的DF转换为NUMPY,再放入用NUMBA装饰的函数中，也不行。
a1=np.array([1,2,3])
a2=np.array(['2020-03','2020-03-08','2020-03-08 20:00'],dtype='datetime64')
df =pd.DataFrame({'a1':a1,'a2':a2})
print(df.values)
print(df.dtypes)
@njit()
def test(x):
    pass
test(df.values)

###测试3，先创建包含时间数据的DF，再把DF转为NUMPY，再放入用NUMBA装饰的函数中，也不行，
a1=np.array(['2020-03','2020-03-08','2020-03-08 20:00'],dtype='datetime64')# 把
a2=np.array([1,2,3])
df =pd.DataFrame({'a1':a1,'a2':a2})
print(df.values)
print(df.dtypes)
@njit()
def test(x):
    pass
test(df.values)

###测试4，先创建包含字符数据的DF，再把DF转为NUMPY，再放入用NUMBA装饰的函数中，也不行，
a1=np.array(['2020-03','2020-03-08','2020-03-08 20:00'],dtype='str')
a2=np.array([1,2,3])
df = pd.DataFrame({'a1':a1,'a2':a2})
print(df.values)
print(df.dtypes)
@njit()
def test(x):
    pass
test(df.values)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

社区专家-Monster-XH 2023-04-12 16:47

关注

基于Monster 组和GPT的调写：

以下是提供的四个测试的解释和建议。

测试1：无法创建包含时间类型的NumPy自定义数据类型
在这个测试中，您试图创建一个包含时间类型的NumPy自定义数据类型。但是，使用空字符串表示缺失值不是一种常见的做法。您可以使用numpy.datetime64('NaT')来表示缺失的日期时间值。以下是一个更新后的示例代码：

import numpy as np
t1 = np.dtype([('age', int), ('date','datetime64[D]')])  # 用 datetime64[D] 表示日期时间
x = np.array([(1, np.datetime64('NaT')), (2, np.datetime64('2018-05-08'))], dtype=t1)

测试2、3、4：
在测试2、3和4中，您将数据框转换为NumPy数组，然后将其传递给用Numba装饰的函数。但是，Numba需要在函数定义之前确定输入数据类型，因此在使用Numba之前，必须明确指定数组的数据类型。这可以通过传递NumPy数组的dtype参数来完成。

以下是测试2、3和4的更新示例代码：

import numpy as np
import pandas as pd
from numba import njit

# 测试2
a1 = np.array([1, 2, 3])
a2 = np.array(['2020-03', '2020-03-08', '2020-03-08 20:00'], dtype='datetime64')
df = pd.DataFrame({'a1': a1, 'a2': a2})
x = df.values.astype([('a1', np.int64), ('a2', 'datetime64[D]')])  # 显式指定数据类型

@njit()
def test(x):
    pass

test(x)

# 测试3
a1 = np.array(['2020-03', '2020-03-08', '2020-03-08 20:00'], dtype='datetime64')
a2 = np.array([1, 2, 3])
df = pd.DataFrame({'a1': a1, 'a2': a2})
x = df[['a2', 'a1']].to_records(index=False).astype([('a2', np.int64), ('a1', 'datetime64[D]')])  # 显式指定数据类型

@njit()
def test(x):
    pass

test(x)

# 测试4
a1 = np.array(['2020-03', '2020-03-08', '2020-03-08 20:00'], dtype='str')
a2 = np.array([1, 2, 3])
df = pd.DataFrame({'a1': a1, 'a2': a2})
x = df.values.astype([('a1', 'U19'), ('a2', np.int64)])  # 显式指定数据类型

@njit()
def test(x):
    pass

test(x)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(3条)

报告相同问题？

关注问题

python的NUMBA装饰符、NUMPY自定义数据类型问题 python
2023-04-12 16:41

回答 4 已采纳基于Monster 组和GPT的调写：以下是提供的四个测试的解释和建议。测试1：无法创建包含时间类型的NumPy自定义数据类型在这个测试中，您试图创建一个包含时间类型的NumPy自定义数据类型。但
numba 库下载总是不成功 python
2022-05-08 09:42

回答 3 已采纳可能网络问题，使用国内镜像试下： pip3 install numba -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirror
关于#python#的问题，如何解决？ python
2022-10-15 11:46

回答 2 已采纳 pip install importlib_metadata安装试试
python numba cuda_Numba：基于CUDA加速的高性能Python
2020-12-24 00:50

缪斯谭的博客 ]Python是一种高效率的动态编程语言，广泛应用于科学，工程和数据分析等领域。导致python如此流行的原因有很多，主要有其简洁且易于理解的语法和标准的数据结构，广泛的功能齐备的标准库，优秀的文档，库和工具构成...
已经安装numpy，却显示No module named 'numpy' python
2022-05-22 03:02

回答 2 已采纳代码第二行，路径写错了，不是环境的问题！
macOS 可以使用Numba实现GPU加速运算吗？ python 机器学习深度学习
2022-05-27 10:58

回答 1 已采纳明确的说, 是不行的, 它的GPU加速本质上底层用的CUDA, 而CUDA必须基于NVIDIA 显卡/GPU, 目前你的Mac上应该没有NVIDIA显卡
在转换模型输出的内容时遇到问题 python 有问必答深度学习
2023-04-13 14:12

回答 2 已采纳引用chatGPT作答，您需要将输出的图片信息转换为base64编码格式以及可供其他模型使用的图像，可以尝试使用以下代码进行转换： import cv2 import base64 import nu
用Python Numba库写CUDA程序（一）
2020-07-23 11:31

jeueuey的博客 Numba，将Python代码编译生成优化后的机器码，提高代码效率。 Numba, a Python compiler from Anaconda that can compile Python code for execution on CUDA-capable GPUs, provides Python developers with an ...
用Cython转换成pyd后，打包出来的程序运行失败。 python 有问必答
2022-06-24 23:15

回答 2 已采纳通过降低pynput版本试试。参考一下这里同样问题的解决办法：https://blog.csdn.net/sj13155158153/article/details/117996613
嵌套循环怎么加快运行速度 python
2021-08-05 17:50

回答 2 已采纳你这样每次循环正则+ == 判断都会使用时间耗费太多。转为多维数组，用pandas中内置的一些方法处理起来，效率会提升很多。
请各位大神帮我看看这个问题啊
2017-01-23 03:00

回答 2 已采纳你这描述太少，光从错误代码来看只知道是IDE的进程错误，当然无法创建工程的。你得明确下面信息： 1、什么情况下出的这个错误，采取了什么操作导致的 2、之前能够正常创建工程吗？ 3、你的开发平
开启全民编程时代！Python小学生都要学的编程语言！
2019-02-14 22:42

逻辑教育_Hank的博客 Python近些年随着大数据，云计算、AI等领域的大规模应用，稳步的在编程语言排行榜上逐步上升，业内也把Python提到了一个相当高的地位。可是Python并不是大家想象中的一个新兴的计算机编程语言，它其实在1989年就被...
cuda运行错误，call to cuMemcpy failed, 返回错误代码700
2018-09-13 07:53

回答 1 已采纳 https://blog.csdn.net/u012348774/article/details/49663299
一篇关于利用numba加速python运行效率的笔记
2022-03-22 11:17

中原H的博客一篇关于加速python代码运行效率的笔记一、原始代码(部分)分析二、变量预分配内存实现加速三、numba装饰器实现加速3.1 为什么numba可以对python代码加速？3.2 修改代码匹配numba的类型支持四、其它尝试4.1 多线程的...
NumPy 高级应用：数组算法与函数应用
2024-04-14 14:51

矩阵猫咪的博客 数据类型或dtype决定了如何将数据解释为浮点、整数、布尔值或任何其他类型。ndarray之所以灵活，部分原因在于每个数组对象都是数据块上的跨行视图。例如，您可能想知道数组视图如何不复制任何数据。原因是ndarray不...
python问题笔记
2023-10-30 15:45

The Straggling Crow的博客 GIL 是 Global Interpreter Lock（全局解释器锁）的缩写，是 Python CPython 解释器（Python 的主流实现）中的一个技术术语。GIL 是一个互斥锁，用于在任何时刻只允许一个线程执行 Python 字节码。这意味着在多线程...
简述与机器学习相关的十大常用Python库，极简化算法编程
2021-07-20 15:38

Java Punk的博客 Python 拥有惊人数量的库，是它能够流行的原因之一。
Python高性能编程
2023-02-10 09:11

yangjiajia123456的博客本文重点关注python性能，先简单介绍下计算机系统和Python虚拟机，为后文做下铺垫；之后使用性能分析工具对Python代码进行性能分析并...最后采取优化代码，并行和异步并发编程，Python集成C语言的方式进行性能优化。
2022年Python技术类面试题总结
2022-09-13 16:15

AudiA6LV6的博客字典如何删除键和合并两个字典 python实现列表去重的方法 python内建数据类型有哪些 python中生成随机整数、随机小数、0–1之间小数方法列出python中可变数据类型和不可变数据类型，并简述原理字典根据键从小到大...
Python常见问题与解决方案
2021-10-31 12:09

HUT_Econometrics的博客常见问题与解决方案问题目录：新的改变功能快捷键合理的创建标题，有助于目录...Python,作为当今主流的编程语言，受到全世界爱好者的追捧。如果你是一名科研小白，导师也许要求你使用它来完成一些任务。确实，入门容易
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月12日

悬赏问题

¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改
¥20 wireshark抓不到vlan
¥20 关于#stm32#的问题：需要指导自动酸碱滴定仪的原理图程序代码及仿真
¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持

python的NUMBA装饰符、NUMPY自定义数据类型问题

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新