首页系统综合问题别再乱套模型了,我用Excel发现了数据分析的本质:回归分析

别再乱套模型了,我用Excel发现了数据分析的本质:回归分析

时间2023-04-24 04:34:59发布分享专员分类系统综合问题浏览195

今天小编给各位分享coreldrawx4广告实例教程的知识,文中也会对其通过别再乱套模型了,我用Excel发现了数据分析的本质:回归分析和如何用excel做回归分析等多篇文章进行知识讲解,如果文章内容对您有帮助,别忘了关注本站,现在进入正文!

内容导航:

  • 别再乱套模型了,我用Excel发现了数据分析的本质:回归分析
  • 如何用excel做回归分析
  • 如何利用Excel中进行高级数据分析之回归分析
  • 如何execl 的数据分析回归
  • 一、别再乱套模型了,我用Excel发现了数据分析的本质:回归分析

    最近很多人都问我,为什么感觉数据分析越学越乱,经常是学了一大堆名词,真正遇到问题的时候却更多是直接套用模型,很难将这些理论联系起来。

    这其实就回归到了一个至关重要的问题:数据分析的本质是什么?

    事物都是万变不离其宗的,一切外在的方法都是为了事物本质而服务的,数据分析自然也不例外,今天我们就来探讨一下数据分析的本质。

    数据分析的本质

    其实绝大多数的数据分析问题,都可以归纳为一个问题:相关性问题。

    相关性分析是数据统计学中的基础思想,主要就是为了探究数据之间是否具有关联性,简单说就是X与Y或者X与Y、Z等之间的变化是否有关联。

    比如,常年吸烟者的数量是否与肺癌患者的数量成正相关、健身者与感冒患者之间是否成负相关等等,这些例子都是简单的相关性判断

    在数据分析中,更常见的则是更为复杂的相关性分析,也就是为了找到变量之间的相关系数,简单说就是为了找到Y=A+B*X之中的B。

    比如,用户点击率与网站访问量之间是否有关系、广告曝光量与投入成本的关系等等,这个方程的求取过程也就是所谓的“回归分析”。

    回归分析在统计学中包含了很多类别,比如一元回归、多远回归、方差回归、线性回归、非线性回归等,但我们不必涉及这么深,只需要了解其本质即可。

    我们就拿广告曝光量与投入成本这个例子来解剖一下数据分析中的回归:

    回归分析

    首先我们假设一个数据分析中常见的场景:

    小李是公司里负责市场广告的,某一次公司要举办大型活动,要求小李在线上广告上达到50w次的曝光量,于是小李写了一份方案提出要加大投入费用。而老板则觉得广告的投入费用太大,没有必要拿那么多钱,而小李则觉得多投入才有效果。

    那么,对于究竟应该投入多少广告成本呢?

    1、分析目的

    于是我们就找到了本次数据分析的目的,就是要找到广告曝光量与费用成本之间的因果关系,也就是投入多少钱,广告曝光就能对应提高多少吗?

    但是普通的统计方法是没办法得到严格的因果关系的,因此我们只能退而求其次地用回归分析来研究其相关关系和影响因子,用相关性代替因果关系。

    2、确定变量

    然后,我们要确定X、Y各是什么。

    在这里Y自然就是广告曝光,也就是因变量,在数据分析中是指业务指标或者核心需求,比如销售额这种我们关心的能够随着其他因素的变化而变化的指标。

    X自然就是投入成本,也就是自变量,在数据分析中是指用来解释业务指标的因子。

    回归分析的任务就是,通过研究X和Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。那么,X到底会长成什么样呢?

    通常情况下X不是一个变量,而是多个变量,比如影响广告曝光的不止是投入成本,还可能是网站SEO等,在实际情况中我们需要将X一个个都找出来,最终的回归方程就变成了:

    这里我们再添加一些其他的影响因素,比如费用投入X2、人力投入X3、投放时间X4、广告点击率X5、对象人群量X6、定价X7、投入广告位数量X8和定向设置量X9。

    3、建立回归模型

    为了找到X与Y之间的变量关系,我们可以通过建立回归模式来实现,这里就用Excel的回归功能简单实操一下。

    将数据直接导入excel中,在“选项”菜单中选择“加载项”,在“加载项”多行文本框中使用滚动条找到并选中“分析工具库”,然后点击最下方的“转到”:

    打开“加载宏”的选项中选择“数据分析库”,然后点击“确定”,就可以将数据分析库加载到Excel中。

    然后点击“数据”菜单栏中的“数据分析”,在跳出的对话框中点击“回归”,然后下拉选取对应的X、Y区域,选择“正态分布”,点击“确定”即可。

    这样就可以得到最终的结果

    4、回归方程检验

    有了回归方程,我们还需要检验一下拟合情况如何。我们主要看的指标有4个:最上面的回归统计表中的Multiple R以及R Square,中间表格中的Significance F,以及下方格中的P-value。

    Multiple R:也就是R值,大于等于0.8即代表正相关,这里我们的R值是0.91,表明广告曝光与投入是正相关。R Square:R的平方值是指拟合系数,这个数值越大则代表回归拟合的越好,这里为0.83,说明拟合效果很好。Significance F:是指显著性检验度,这个值越小就代表因变量和自变量之间的关联性越显著,这里数值等于0.006,说明成本投入是影响广告曝光最显著的因素。P-value:是指系数的显著性检验度,一般大于0.05就不具有统计学意义了,小于0.05说明具有统计学意义。这里数值基本都小于0.05,说明这个结果极具统计学意义。

    5、回归方程

    最终按照图中得到值就可以得到回归方程,这样小李再向老板申请广告投入费用的时候,就不怕被老板说了。

    最后简单总结一下。什么是回归分析?回归分析一句话:就是研究XY相关性的分析。

    我们碰到的绝大多数数据分析问题,仔细想一下,都可以被规范成一个回归分析的问题。而对于真实的工作而言,能否把这个问题,成功的规范成为一个回归分析问题,是实际项目成功的关键。而规范是否成功的一个具体表现就是:第一,因变量Y是否定义清晰;第二,解释性变量X是否精准有力。

    一、如何用excel做回归分析

    方法如下: 
     选择成对的数据列,将使用“X、Y散点图”制成散点图。
    在数据点上单击右键,选择“添加趋势线”-“线性”,并在选项标签中要求给出公式和相关系数等,可以得到拟合的直线。
    由图中可知,拟合的直线是y=15620x+6606.1,R2的值为0.9994。
    因为R2
    >0.99,所以这是一个线性特征非常明显的实验模型,即说明拟合直线能够以大于99.99%地解释、涵盖了实测数据,具有很好的一般性,可以作为标准工作曲线用于其他未知浓度溶液的测量。
      为了进一步使用更多的指标来描述这一个模型,我们使用数据分析中的“回归”工具来详细分析这组数据。
     在选项卡中显然详细多了,注意选择X、Y对应的数据列。“常数为零”就是指明该模型是严格的正比例模型,本例确实是这样,因为在浓度为零时相应峰面积肯定为零。先前得出的回归方程虽然拟合程度相当高,但是在x=0时,仍然有对应的数值,这显然是一个可笑的结论。所以选择“常数为零”。
      “回归”工具为我们提供了三张图,分别是残差图、线性拟合图和正态概率图。重点来看残差图和线性拟合图。
     在线性拟合图中可以看到,不但有根据要求生成的数据点,而且还有经过拟和处理的预测数据点,拟合直线的参数会在数据表格中详细显示。本实例旨在提供更多信息以起到抛砖引玉的作用,由于涉及到过多的专业术语,请各位读者根据实际,在具体使用中另行参考各项参数,此不再对更多细节作进一步解释。

    残差图是有关于世纪之与预测值之间差距的图表,如果残差图中的散点在中州上下两侧零乱分布,那么拟合直线就是合理的,否则就需要重新处理。
     更多的信息在生成的表格中,详细的参数项目完全可以满足回归分析的各项要求。下图提供的是拟合直线的得回归分析中方差、标准差等各项信息。

    二、如何利用Excel中进行高级数据分析之回归分析

    以Excel2010为例。 1、“开发工具”选项卡 中单击“加载项”组中的“加载项”按钮,打开“加载宏”对话框。如下图。勾选 “分析工具库”。 2、“数据”选项卡中“分析”组中的“数据分析”按钮,打开“数据分析”对话框。如下图。单击“回归”选项。 剩下的楼主自己...

    三、如何execl 的数据分析回归

    在日常数据分析工作当中,回归分析是应用十分广泛的一种数据分析方法,按照涉及自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

    回归分析的实施步骤:

    1)根据预测目标,确定自变量和因变量

    2)建立回归预测模型

    3)进行相关分析

    4)检验回归预测模型,计算预测误差

    5)计算并确定预测值

    我们接下来讲解在Excel2007中如何进行回归分析?

    一、案例场景

    为了研究某产品中两种成分A与B之间的关系,现在想建立不同成分A情况下对应成分B的拟合曲线以供后期进行预测分析。测定了下列一组数据:

    二、操作步骤

    1、先绘制散点图:具体步骤是选中数据,插入—>图表—>散点图

    2、在散点图的数据点上右键—>添加趋势线

    3、在弹出的选项框的选项中选择公式和相关系数等,这样就以得到拟合的直线

    在图中我们可以看到,拟合的回归方程是 y = 0.223x + 9.121,R² = 0.982

    附:R2相关系数取值及其意义

    我们进一步使用Excel中数据分析的回归分析提供更多的分析变量来描述这一个线性模型

    4、选中数据—>数据—>数据分析—>回归

    注:本操作需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,可以参考该专题文章的第一篇《用Excel进行数据分析:数据分析工具在哪里?》。

    关于coreldrawx4广告实例教程的问题,通过《如何利用Excel中进行高级数据分析之回归分析》、《如何execl 的数据分析回归》等文章的解答希望已经帮助到您了!如您想了解更多关于coreldrawx4广告实例教程的相关信息,请到本站进行查找!

    爱资源吧版权声明:以上文中内容来自网络,如有侵权请联系删除,谢谢。

    coreldrawx4广告实例教程
    移动硬盘数据恢复 拯救我的文件们-希捷 Backup Plus恢复 吾爱破解论坛闭网调整,发烧机友何去何从