题目要求如下
研究居民家庭教育支出和消费性支出之间的关系,收集到1978年至2002年全国人均消费性支出和教育支出的数据。(数据文件:相关回归分析(年人均消费支出和教育.sav)
(1)首先绘制教育支出(X5)和消费性支出(X2)的散点图,观察散点图发现两变量之间呈非线性关系,可尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计对1990年到2002年数据进行本质线性模型分析。其中,教育支出(X5)为被解释变量,消费性支出(X2)为解释变量。
(2)利用1981年到2002年的数据绘制就餐费用(X4)和年份(nf)之间散点图和线图,对居民未来在外就餐费用的趋势进行分析和预测;尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计对年份(nf)和就餐费用(X4)进行本质线性模型分析。
已经写出源代码如下
library(foreign)
library(ggplot2)
data=read.spss("C:\\Users\\ASUS\\Desktop\\南京理工大学\\R语言\\实验课\\实验四线性回归建模\\数据及代码\\相关回归分析(年人均消费支出和教育).sav",to.data.frame=TRUE)
data
data1 <- data[, c("NF", "X2", "X5")]
# 重命名列名
colnames(data1) <- c("年份", "消费性支出", "教育支出")
# 绘制散点图
ggplot(data1, aes(x = 消费性支出, y = 教育支出)) +
geom_point() +
labs(x = "consumption", y = "Education") +
theme_minimal()
# 拟合二次曲线模型
model_quadratic <- lm(教育支出 ~ 消费性支出 + I(消费性支出^2), data = data1)
new_data <- data.frame(消费性支出 = seq(min(data1$消费性支出), max(data1$消费性支出), length.out = 100))
new_data$教育支出 <- predict(model_quadratic, newdata = new_data)
# 绘制散点图和拟合的二次曲线
ggplot(data1, aes(x = 消费性支出, y = 教育支出)) +
geom_point() +
geom_line(data = new_data, aes(x = 消费性支出, y = 教育支出), color = "red") +
labs(x = "consumption", y = "Education") +
theme_minimal()
# 提取所需的列(年份、就餐费用)
data2 <- data[data$NF >= 1981 & data$NF <= 2002, c("NF", "X4")]
# 重命名列名
colnames(data2) <- c("年份", "就餐费用")
# 绘制散点图
plot(data2$年份, data2$就餐费用, xlab = "Year", ylab = "Eat", main = "年份与就餐费用的关系", pch = 16)
# 拟合二次曲线模型
model_quadratic <- lm(就餐费用 ~ 年份 + I(年份^2), data = data2)
# 预测未来就餐费用
future_years <- seq(2003, 2030, by = 1)
predicted_data <- data.frame(年份 = future_years)
predicted_data$就餐费用 <- predict(model_quadratic, newdata = predicted_data)
# 绘制拟合的二次曲线
lines(predicted_data$年份, predicted_data$就餐费用, col = "red", lwd = 2)
# 输出拟合模型的系数
coefficients(model_quadratic)
输出结果如下:
请根据给出的结果按照要求写一段文字的数据分析