判断两个地址是不是同一个地址,例如:
北京市丰台区方庄芳群园四区16-x-xxx
北京丰台群园四区16-x-xxx
判读这两个地址是不是同一个位置,
请问我现在没有样本库,只有两万个比较干净的数据,如何去开展?
我现在是做的是先安行政区级别划分
比如:北京市/丰台区/新村街道/汉威广场/12号楼7层
现在是到街道包括街道 这些描述都可以标准化 切分后的后两部分想要匹配的话 该怎么做?
判断两个地址是不是同一个地址,例如:
北京市丰台区方庄芳群园四区16-x-xxx
北京丰台群园四区16-x-xxx
判读这两个地址是不是同一个位置,
请问我现在没有样本库,只有两万个比较干净的数据,如何去开展?
我现在是做的是先安行政区级别划分
比如:北京市/丰台区/新村街道/汉威广场/12号楼7层
现在是到街道包括街道 这些描述都可以标准化 切分后的后两部分想要匹配的话 该怎么做?
关注让阿豪来帮你解答,本回答参考chatgpt3.5编写提供,如果还有疑问可以评论或留言针对判断两个地址是否为同一位置的问题,可以采用地址的标准化和字符串匹配的方法进行处理。具体步骤如下:
def similarity(str1, str2):
# 计算两个字符串的相似度(示例采用Jaccard相似系数)
set1 = set(str1)
set2 = set(str2)
intersection = len(set1 & set2)
union = len(set1 | set2)
jaccard_similarity = intersection / union
return jaccard_similarity
def is_same_location(address1, address2):
# 对地址进行标准化、切分和字符串匹配
standardized_address1 = address1.replace(" ", "").lower() # 去除空格和大小写统一
standardized_address2 = address2.replace(" ", "").lower()
parts1 = standardized_address1.split("/")
parts2 = standardized_address2.split("/")
# 只比较后两部分的相似度
similarity_score = similarity(parts1[-2], parts2[-2])
if similarity_score > 0.9: # 设定相似度阈值
return True
else:
return False
# 示例地址进行判断
address1 = "北京市/丰台区/新村街道/汉威广场/12号楼7层"
address2 = "北京/丰台/新村街道/汉威广场/12号楼7层"
result = is_same_location(address1, address2)
print(result)
以上是一个简单的地址匹配示例,根据实际情况可以根据数据的特点进一步优化和调整算法。同时,建议在真实数据上进行验证和调试,以确保匹配的准确性。