python多进程与np数组与talib计算金融指标问题

cpu24核心笔记本电脑2个内存条16g 3200m x2，用1核运行速度是50+每秒it。用10个应该是500+。但是只有170+，我尝试从1核到10核测试，发现到3核后就不是成倍增加了，后面增加核心速度变快的很少。是不是内存速度瓶颈。

 with Pool(processes=workers) as pool:  #
            # 使用并行批量获得<class 'list'>
            results = pool.imap_unordered(
                # 先测试单个核心一秒多少个，用于设置chunksize参数
                partial(calculate_by_one_loop, duo_lock=duo_lock), para_list, chunksize=50)
            # 显示进度条
            for i, result in tqdm(enumerate(results),
                                  total=total, desc='总任务进度', mininterval=1, maxinterval=1):
                df_list.append(result)

其中calculate_by_one_loop是目标函数，里面就执行np数组的计算

x = talib.SMA(close, timeperiod=10)

@jit('float64[:,:](float64[:], float64[:], float64[:], float64[:])')
def numpy_chaoji_qushi(atr, close, high, low):
    """
    超级趋势计算

    :param atr: 真实波动幅度
    :param close: 收盘
    :param high: 最高
    :param low: 最低
    :return: 超级趋势
    """

    src = np.full_like(close, np.nan, dtype='float64')  # 生成空白的数组，结构和close一样
    up = np.full_like(close, np.nan, dtype='float64')  # 生成空白的数组，结构和close一样

    dn = np.full_like(close, np.nan, dtype='float64')  # 生成空白的数组，结构和close一样

    for i in range(close.shape[0]):
        # 价格源hlc3
        src[i] = (close[i] + high[i] + low[i]) / 3
        # 计算超级趋势指标的上涨趋势线
        up[i] = src[i] - atr[i]
        # 过去的收盘价 大于 up[1]
        if close[i - 1] > up[i - 1]:
            # up就等于 up 与up1 中最大的
            up[i] = max(up[i], up[i - 1])
        else:  # 不是就返回up自己
            up[i] = up[i]
        # 计算超级趋势指标的下跌趋势线
        dn[i] = src[i] + atr[i]
        # 过去的收盘价 大于 up[1]
        if close[i - 1] < dn[i - 1]:
            # up就等于 up 与up1 中最大的
            dn[i] = min(dn[i], dn[i - 1])
        else:  # 不是就返回up自己
            dn[i] = dn[i]

    return np.vstack((up, dn))

很多这种使用talib的代码，基本用5列数组会生成几十上百列。再循环判断逻辑。我测试过单次计算50多ms
之前我是使用pandas的df
例如：df['x'] = talib.SMA(df['close'], timeperiod=10)
后面改成np数组，没使用一点df。速度提升了一点点。我重新写了一个只计算数学问题的程序，速度是随着进程数成倍增加的。我20核全开速度就比1核快将近20倍。所以我怀疑内存速度，但是我不知道怎么优化，已经从df数据改成np数组了。每计算一个金融指标（均线这些）就有一个单独的变量存起来。我看别人用服务器cpu和主板和内存，开几十上百个线程，速度飞快
帮我优化一下

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
谁在墙外等红杏企业官方账号 2023-03-21 10:36
关注
可能是内存速度瓶颈，也可能是其他因素导致的。在多核并行计算中，除了CPU核心数和内存大小外，还有很多因素会影响计算速度，比如硬盘速度、缓存大小、算法复杂度等等。因此，要想准确分析速度瓶颈，需要对整个系统进行综合评估，包括硬件和软件方面。

另外，从1核到10核速度增加不是成倍增加，这也是正常现象。多核并行计算的速度增加并不是线性的，随着核心数的增加，计算效率会逐渐降低，因为多核并行计算需要更多的协调和同步，而这些操作也需要消耗一定的时间和资源。

总之，要想提高多核并行计算的速度，需要从多个方面入手，包括优化算法、提高硬件性能、合理调整系统参数等等。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

python多进程与np数组与talib计算金融指标问题 python windows 数据结构
2023-03-20 20:05

回答 3 已采纳可能是内存速度瓶颈，也可能是其他因素导致的。在多核并行计算中，除了CPU核心数和内存大小外，还有很多因素会影响计算速度，比如硬盘速度、缓存大小、算法复杂度等等。因此，要想准确分析速度瓶颈，需要对整个系
Python QMT系统引用talib遇到问题，帮看看怎么改？ python 有问必答
2021-10-23 18:52

回答 1 已采纳数据类型错误，检查一下histdict是什么类型数据，sp12数据是否符合EMA参数传递要求，可以输出一下看看，print(sp12)。
关于python中的一些语法问题 python 开发语言
2023-01-18 17:14

回答 2 已采纳 Union 是 Python 的类型提示库中的一个类型，用来表示可能是多种类型之一。在这里，Union[Tuple[np.ndarray, np.ndarray], Tuple[float, floa
windows python11 x64 talib 版本
2023-06-08 18:30

windows python11 x64 talib 版本
数值计算，python实时数值判断，判断当前实时数值是否超出阈值 python
2022-03-03 14:08

回答 2 已采纳是这个意思？ from time import sleep current_p = 0 # 定义阈值 A = 1 B = 100 while True: #**************
安装成功talib后，import talib出错 python
2022-10-27 10:30

回答 8 已采纳 m1 Mac安装talib库(symbol not found in flat namespace '_TA_ACOS'解决办法) - 知乎
无法下载talib，终端第一个词变黄 python 数据库
2022-04-12 19:19

回答 1 已采纳 win+r输入cmd输入pip install talib如有用请采纳
基于python快速简便地实时计算金融技术指标
2022-02-10 21:37

阿岛格的博客从简单应用到平台框架应用，不同场景下，基于python快速简便地实时计算金融技术指标的方法，总结如下（鄙人之前走了不少弯路，以下五种场景实现及避坑方法，分别介绍给各位朋友，请借鉴）：一、tradingview的方法库...
talib库中没有STDDEV怎么解决？ python 机器学习深度学习
2021-01-10 23:05

回答 1 已采纳 talib安装了没。同opencv安装方式一样。（和普通库安装是有差别的）
我用pyinstaller打包成exe，运行时报ModuleNotFoundError: No module named 'talib.stream'，有人知道怎么解决吗 python 有问必答
2021-12-01 11:15

回答 1 已采纳在 pyinstaller指令上使用了 --hidden-import 功能试试
macos 使用pycharm安装ta-lib报错 macos pycharm python
2022-02-26 23:43

回答 1 已采纳先安装这个依赖$ brew install ta-lib再重新pip install
python 股票指标库talib_Talib金融库的使用
2020-12-15 10:54

weixin_39878991的博客在这里我们使用掘金量化平台获取数据以及后续...我们只需额外加上我们另外要调用的包即可import numpy as npimport talib这里注意，Talib 的安装是以下命令：pip install Ta-Lib一、数据获取与滑动平均值的计算data ...
量化均线策略设置初始函数报错 python
2023-01-22 18:00

回答 1 已采纳错误是因为set_benchmark函数未被调用或者参数不正确。在代码的initialize函数中，set_benchmark('000300.XSHG') 应该在set_option('use_r
talib计算指标
2021-11-12 10:03

python量化交流的博客一、 Talib 注：每部分结尾都有该部分所有指标整理 1.1 Overlap Studies(重叠指标) 1.1.1 移动平均线移动平均线是技术分析理论中应用最普遍的指标之一，主要用于确认、跟踪和判断趋势，提示买入和卖出...
talib-macd-example:在Python中使用matplotlib使用TA-lib呈现MACD指标的示例
2021-05-08 15:30

talib-macd-example 在Python中使用matplotlib使用（在Python 2.7中）呈现指标的示例。这段代码是对名为的用户在上的问题的解答。他的问题可以在找到。
国内股票MACD指标计算，Python实现MACD指标计算，Talib实现MACD指标计算
2021-10-09 21:54

晨&航的博客 MACD指标是最为常见的指标之一，股票每日的K线数据通过Tushare、Baostock等平台能够获取到个股及指数的Open、High、Low、Close、Volume等数据，MACD等技术指标虽然同花顺等财经网站都算好了，但是这写指标确没有接口...
国内股票KDJ指标计算，Python实现KDJ指标计算，Talib实现KDJ指标计算
2021-10-07 22:34

晨&航的博客 KDJ指标是最为常见的指标之一，股票每日的K线数据通过Tushare、Baostock等平台能够获取到个股及指数的Open、High、Low、Close、Volumn等数据，KDJ、MACD等技术指标虽然同花顺等财经网站都算好了，但是这写指标确没有...
基于python计算滚动方差(标准差)talib和pd.rolling函数差异详解
2020-09-16 17:52

主要介绍了基于python计算滚动方差(标准差)talib和pd.rolling函数差异详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
pandas_talib:Python Pandas实现的技术分析指标
2021-05-16 11:04

Python Pandas技术指标的实现原始版本来自：贡献者莱昂纳多·拉扎罗和所有... 也可以看看：熊猫人 llazzaro /分析仪 https://www.quantopian.com/posts/technical-analysis-indicators-without-talib-code ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月20日

悬赏问题

¥15 对于squad数据集的基于bert模型的微调
¥15 为什么我运行这个网络会出现以下报错？CRNN神经网络
¥20 steam下载游戏占用内存
¥15 CST保存项目时失败
¥15 树莓派5怎么用camera module 3啊
¥20 java在应用程序里获取不到扬声器设备
¥15 echarts动画效果的问题，请帮我添加一个动画。不要机器人回答。
¥15 Attention is all you need 的代码运行
¥15 一个服务器已经有一个系统了如果用usb再装一个系统，原来的系统会被覆盖掉吗
¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时，终端显示出了sequence handled的进度条，但是并不出结果就自动终止回到命令提示行了是怎么回事：

python多进程与np数组与talib计算金融指标问题

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新