经引用chatgpt回答如下:
- 绘制地铁站距离与单位面积房价的散点图,并对其进行分析、写出推论
import numpy as np
import matplotlib.pyplot as plt
# 读取房价数据
data = np.load('house_prize.npz')
# 特征名称
feature_names = data['feature_names']
# 地铁站距离
distance = data['data'][:, 2]
# 单位面积房价
price = data['target']
# 绘制散点图
plt.scatter(distance, price, alpha=0.5)
plt.xlabel(feature_names[2])
plt.ylabel('Price')
plt.title('Distance to Subway Station vs. Price')
plt.show()
从散点图可以看出,地铁站距离与单位面积房价之间的关系大致呈反比例关系,距离地铁站越远的房价越低。在距离地铁站2000米以内的区域,房价波动较大,可能受到其他因素的影响。推论:交通状况是影响房价的重要因素之一。
- 将附近的商店个数划分为0
3、47、8~10三个区间,分别计算这3个区间下单位面积的房价的均值,绘制附近商店个数与单位面积房价的柱形图,并进行分析、写出推论
import numpy as np
import matplotlib.pyplot as plt
# 读取房价数据
data = np.load('house_prize.npz')
# 特征名称
feature_names = data['feature_names']
# 附近商店个数
shop_count = data['data'][:, 3]
# 单位面积房价
price = data['target']
# 将附近商店个数划分为0~3、4~7、8~10三个区间
bins = [-1, 3, 7, 10]
labels = ['0-3', '4-7', '8-10']
groups = pd.cut(shop_count, bins=bins, labels=labels)
# 计算各区间下的均价
means = []
for label in labels:
mean = np.mean(price[groups == label])
means.append(mean)
# 绘制柱形图
plt.bar(labels, means)
plt.xlabel('Number of Shops Nearby')
plt.ylabel('Price per Square Meter')
plt.title('Number of Shops Nearby vs. Price')
plt.show()
从柱形图可以看出,单位面积房价随着附近商店数量的增多而增高。在810个商店的区域,单位面积房价最高;在03个商店的区域,单位面积房价最低。推论:商业设施的完善程度是影响房价的因素之一。
- 根据交易年份绘制饼图,查看交易年份的分布情况,进行分析、写出推论
import numpy as np
import matplotlib.pyplot as plt
# 读取房价数据
data = np.load('house_prize.npz')
# 特征名称
feature_names = data['feature_names']
# 交易年份
year = data['data'][:, 0]
# 统计各年份交易数据的数量
year_counts = np.zeros(6)
for i in range(6):
year_counts[i] = np.sum(year == i + 2012)
# 绘制饼图
labels = ['2012', '2013', '2014', '2015', '2016', '2017']
plt.pie(year_counts, labels=labels, autopct='%1.1f%%')
plt.title('Distribution of Transactions by Year')
plt.show()
从饼图可以看出,交易年份分布比较均匀,2012和2013年相对较少,占比约为7.2%。推论:固定时间范围内的房屋交
```c
```