我们已经更新我们的隐私政策使它更加清晰我们如何使用您的个人资料。

我们使用cookie来提供更好的体验。你可以阅读我们的饼干的政策在这里。

广告

计算最小二乘回归:方程,例子,解释

图表显示x和y轴之间的正相关关系。两个问号坐在左上角和右下角的图。

希望这篇文章的一个免费的PDF版本吗?

完成下面的表格,我们将电子邮件您的PDF版本“最小二乘回归计算线:方程,例子,解释”

听与
喋喋不休地说
0:00
注册免费听这篇文章
谢谢你!听这篇文章使用上面的球员。
阅读时间:

能够做出结论关于数据的趋势是最重要的步骤之一,在商业和科学。的面包和黄油的市场分析师意识到特斯拉的股票炸弹Elon Musk每次出现在喜剧的播客,以及科学家计算需要多少火箭燃料驱动一辆车进入太空。


如何找到一个最小二乘回归

通常我们问的问题需要我们做出准确的预测之一因素影响一个结果。如果一个老师是问如何工作花时间写一篇文章影响论文的成绩,很容易看一个图的时间写论文和论文成绩说“嘿,花更多的时间在他们的论文的人得到更好的成绩。“什么是更加困难(和现实,很可能)眼睛是试着去做预测得到什么分数会有人在一篇基于他们花了多长时间。当然,还有其他因素在起作用就像特定类的学生有多好,但我们会忽视混淆现在这样的因素和工作通过一个简单的例子。

我们的老师已经知道有多少时间是花在一个积极的关系和年级作文一篇文章,但是我们需要一些数据正确地证明这一点。

最小二乘回归直线的例子

图表比较成绩和小时花在一篇文章上。

假设我们想估计分数对那些花了2.3小时上一篇文章。我相信我们中的大多数人的绘画经验行最适合,我们排队尺子,认为“这似乎是正确的”,画一些线条从X到Y轴。一屋子的人,你会发现没有最适合的两行完全相同。我们需要回答这个问题最好的最适合线。

图形之间的情节可能回归品位和小时花在论文上。


通过总结回归最小的魔法,和一些简单的方程,我们可以计算一个预测模型,可以让我们估计成绩远比单靠视觉更准确。回归分析是一种非常强大的分析工具中使用经济学和科学。有很多受欢迎的统计程序,可以构造复杂的回归模型为各种不同的需求。这样一个简单的模型需要一些数据而已,也许一个计算器。值得注意的是在这一点上,这种方法适用于连续的数据

最小二乘回归方程

回归模型的前提是检查一个或多个自变量的影响(在这种情况下时间写一篇文章)因变量的利益(在这种情况下,论文成绩)。这样的线性回归分析是基于一个简单的方程:
Y = a + bX

Y -论文成绩一个——拦截b——系数X -时间花在论文上

有几个关键的外卖从上面的方程。首先,拦截(一个)是我们期望得到的论文成绩当论文所花费的时间是零。你可以想象你可以记下一些关键要点而支出仅一分钟一篇,仍有几点。每一篇文章至少都会有这个分数根据我们的模型。最重要的是,每小时花在我们的论文(X)会导致增加b在年级的这篇文章。我们可以计算出b通过以下,略可怕的方程:
一个方程计算系数,b。

但是我们要提前。计算b理解,令人毛骨悚然的方程,我们需要知道我们的数据的值:

一个表显示值的数据。

如何计算一个最小二乘回归行吗?

当计算最小二乘回归,是第一步找到依赖和独立变量的方法。我们这样做是因为一个有趣的怪癖——线将线性回归行总是交叉的两个相交。我们可以把它作为一个锚点,当我们知道回归线总是横在我们的测试中得分数据(4.72,64.45)

图表对比等级与小时花在一篇文章上。


第二步是计算每个值和平均值的区别的依赖和独立变量。在这种情况下,这意味着我们从每个测试分数减去64.45和4.72从每个数据点的时间。此外,我们希望找到一起乘这两个不同的产品。


依赖和独立变量的计算一个数据表格。

你应该注意一些分数低于平均得分,我们结束了负值。通过这些差异的棱角,我们最终得到一个标准化的测量的平均偏差不管值或多或少比的意思。

让我们提醒自己我们需要计算的方程b

一个方程计算系数,b。

象征西格玛()告诉我们我们一起需要添加所有相关的值。

如果我们做上面的表中,我们得到了以下结果:



∑(x̅) *(等号左边̅)= 611.36



∑(x̅) ^ 2 = 94.18


插在上面的信息从表到一个计算器允许我们计算b,这是一步两种开启我们的闪闪发光的新模型的预测能力:



最后一步是计算拦截,我们可以使用初始值的回归方程测试分数和时间设置为各自的含义,以及我们的新计算系数。


64.45 = 4.72 + 6.49 *

我们可以解决这个问题一个:


64.45 = 30.63 +

一个= 64.45 - 30.63

一个= 30.18


现在我们已经为我们的方程和所需的所有信息都是免费的值作为我们认为合适的位置。如果我们想知道预测年级花2.35小时的人的文章,我们需要做的就是在交换X


y = 30.18 + 6.49 * X

y = 30.18 + (6.49 * 2.35)

y = 45.43


用手画一个最小二乘回归直线

如果我们想画一个最适合线,我们可以计算一系列的时间值的估计成绩,然后连接用一把尺子。正如我们前面所提到的,这条线应该交叉的文章所花费的时间和平均成绩。


最小二乘回归行显示链接年级与小时花在论文上。

还有我们!完美的预测模型,将使我们的教师生活容易得多。

最小二乘回归的缺点是什么?

*大家可能已经注意到,这样一个模型有其局限性。例如,如果一个学生在一篇文章花了20个小时,他们的预测分数是160,并没有真正意义上一个典型的0 - 100的规模。它总是重要的了解现实的真实模型的局限性和确保它不被用来回答问题不适合。

这些异常值对我们的数据可以有一个不成比例的影响。在这种情况下,是很重要的组织你的数据并验证您的模型根据你的数据是什么样子,以确保它是正确的做法。

本文最初上传于10月2日,2020年8月21日,2018年,最后一次更新。



广告
Baidu