|
软件系统和计算方法
正确的文章链接:
Ignatenko A.M., Makarova I.L., Kopyrin A.S.
弱结构时间序列分析的数据准备方法
// 软件系统和计算方法.
2019. № 4.
С. 87-94.
DOI: 10.7256/2454-0714.2019.4.31797 URL: https://cn.nbpublish.com/library_read_article.php?id=31797
弱结构时间序列分析的数据准备方法
Ignatenko Anna Mikhailovna
索契州立大学应用数学与计算机科学系高级讲师
354000, Russia, Krasnodarskii krai, g. Sochi, ul. Plastunskaya, 94
|
allrededor@mail.ru
|
|
|
Makarova Irina Leonidovna
博士学位 技术科学
索契州立大学应用数学与计算机科学系系系主任
354000, Russia, Krasnodarskii krai, g. Sochi, ul. Plastunskaya, 94
|
ratton@mail.ru
|
|
|
|
Kopyrin Andrey Sergeevich
博士学位 经济学
索契州立大学信息技术系系主任
354000, Russia, Krasnodarskii krai, g. Sochi, ul. Plastunskaya, 94
|
kopyrin_a@mail.ru
|
|
|
|
DOI: 10.7256/2454-0714.2019.4.31797
评审日期
20-12-2019
出版日期
06-01-2020
注解:
该研究的目的是为弱结构化源数据的分析,它们的分析做好准备,并研究数据的"污染"对回归分析结果的影响。 结构化数据,为定性分析做好准备的任务对于每组特定的源数据来说都是一项独特的任务,不能使用通用算法来解决,它总是有自己的特殊性。 使用弱结构化数据考虑可能导致工作困难(分析,处理,搜索)的问题。 给出了在用于分析的数据准备程序中使用的弱结构化数据和结构化数据的示例。 考虑并描述了制备用于分析的弱结构化数据的这些算法。 在一个数据集上进行清洗和分析程序。 构建并比较了四个回归模型。 结果,得出了以下结论:从分析中排除各种可疑观察可以大大减少人口数量并导致变异的不合理减少。 与此同时,如果因此将重要的观测对象排除在分析之外并且违反整体的完整性,则这种方法将是完全不可接受的。 构造的模型的质量在存在异常值的情况下可能劣化,但也可能由于它们而改善。
出版日期:
弱结构化数据, 清除数据, 弱结构化数据, 回归分析, 清除数据, 回归分析, 搜索异常, 搜索异常, 线性模型, 线性模型, 大数据, 大数据, 统计数字, 统计数字, 建模, 建模, 消除噪音, 消除噪音, 计量经济学, 计量经济学
|