这个问题根本不在于高次拟合的问题。
如果只是想拟合出一条平滑的曲线的话, 确实像某答案说的,四次拟大象,五次鼻子晃。
问题在于:
1 二次多项式就可以拟合。
2 拟合的精度高, 三个9级别的。
3 原博作者不止是拟合, 他还用他回归出的模型,预测了2019年的数据,误差1%之内。
4 客观世界中销售数据是一个复杂问题,受无数因素影响,不该是二次或者三次多项式就可以描述的(原文这里用词是拟合,评论里有人指出,改为描述)。
综上所述, 才断定销售数据并非自然销售数据(例如很多答主说的先定KPI后强行补贴完成)。
各种说其他数据,例如茅台,美国GDP也能拟合的。 拜托你们用二次或者三次回归的模型, 来预测下2019年茅台的销售额和美国的GDP增长率? 我们明年检验下?
补充: 美国名义gdp总量年度之间相对稳定,对于某年来说,1%的gdp总量差异在经济学上有显著差别,而数据1%视觉上又给人很小的感觉,会视觉上缩小预测的误差。所以用gdp增长率代替名义gdp总量更能反应预测的准确度。
_______________________________分割线
补充答案。。多年不学数学了,但是excel还是会玩的,如果下边计算有错误,欢迎数学大佬指出我修改。
很多人说预测美国gdp也很准的,我就来预测一下美国的gdp。前文说了,美国gdp1%是有显著的经济学意义的(也就是预测有1%的误差几乎可以说是狗头经济学家了,和双11误差1%完全不是一个概念),所以我对数据做标准化处理,来看预测偏离多少个标准差。当然,美国19年数据还没出,我只能用08-17数据来预测18数据。
上图。
上边是原始数据,后边是标准化(x-样本均值/样本标准差)过的数据(标准化后样本均值0,标准差1)
可以看出,2018年预测值和实际值差了0.35个标准差。
没有对比就没有伤害,来看看淘宝双11的。
差距还不到0.01个标准差。
评论里有大佬提到了非平稳序列问题,我去查了下资料,大致意思就是非平稳序列可能会产生伪回归,所以回归中建议使用时间序列的一阶差分(这个我也不懂,也有大佬提出了相反意见:如何看待有人质疑淘宝双十一数据造假,并在4月份成功预测今年销售额为2680亿?)。所以对此我不做什么评价,只计算下数据。
由此预测出的2019年增量和实际差了34亿,大约0.17个标准差。
用511加2135,得出2019年预测值为2646,实际销售额为2680,误差34/2680=1.27%。
也就是说用一阶差分来预测2019年双11销量,误差为1.27%。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有