参考GPT和自己的思路:你可以使用scipy.spatial.distance.cdist函数来计算两个array之间的距离,并使用argsort函数和切片来找到表1每个点与表2中距离最近的40个点。以下是一个示例代码,它使用分块计算来加快速度:
import numpy as np
from scipy.spatial.distance import cdist
# 假设points1和points2是两个array,每一行代表一个点的坐标
points1 = np.random.rand(100000, 3)
points2 = np.random.rand(200000, 3)
# 将points2划分成多个块,每个块包含1000个点
block_size = 1000
blocks2 = [points2[i:i+block_size] for i in range(0, len(points2), block_size)]
# 计算每个点在points1中与所有块中的点的距离,并找到每个点距离最近的40个点的索引
k = 40
distances = []
for block2 in blocks2:
dist = cdist(points1, block2)
indices = np.argpartition(dist, k-1)[:, :k]
distances.append((dist, indices))
distances = np.concatenate(distances, axis=1)
nearest_indices = np.argsort(distances, axis=1)[:, :k]
# 最近的40个点在points2中的坐标
nearest_points2 = np.concatenate([blocks2[i][nearest_indices[:, i]] for i in range(len(blocks2))])
# 计算表1每个点与最近的40个点的距离
distances = np.linalg.norm(points1[:, np.newaxis] - nearest_points2, axis=2)
这个代码首先将points2划分成多个块,并分别计算每个点在points1中与所有块中的点的距离,然后找到每个点距离最近的40个点的索引。最后,它计算最近的40个点在points2中的坐标,并计算表1每个点与最近的40个点的距离。