主页 > imtoken冷钱包安全吗 > Mirror Mirror 告诉我,数字货币未来的价格可以预测吗?

Mirror Mirror 告诉我,数字货币未来的价格可以预测吗?

imtoken冷钱包安全吗 2023-09-04 05:13:14

雷锋网记者:自比特币价格暴涨以来,数字货币炒作不断。 每天都有新数字货币的消息,有的被证明是骗局,有的将在几个月后成为新的头号货币。 货币投机者通常为谣言买卖。 自然地,有人尝试用机器学习来分析数字货币的价格变化,找出影响数字货币价格变化的因素。 近日在外媒Medium上,一位名叫Chalita Lertlumprasert的博主发表了一篇关于如何使用机器学习来预测数字货币价格变化的文章。 雷锋网整理如下:

数字货币价格变动的机器学习原理分析

在经典时间序列分析中,我们将观察到的时间序列视为模式和随机变量的组合。 使用这种方法,我们可以根据历史数据预测未来的价值。 这种方法在大多数情况下都有效,但如果时间序列更加随机怎么办? 如果一个时间序列主要是基于当前事件的推测,而不是具有某种内部模式呢? 嗯,你猜对了,便宜的数字货币就是这样。

那么,究竟是什么推动了数字货币的价格上涨? 炒作数字货币? 创新? 法律问题? 公共媒体? 供需变化? 比特币有多受欢迎? 甚至,土豪一时心血来潮,决定购买一百万代币? 好的,现在是让数据说话的时候了。

那么,哪些因素会影响加密货币价格?

因素 1:许多人说,答案是比特币(价格)。 区块链技术是由比特币首先实现的去中心化数据库系统,被认为是极有可能改变现代商业模式的技术趋势。 随着比特币越来越受欢迎,同样基于区块链技术的替代数字货币不断推出。 从某种意义上说,比特币是几乎所有数字加密货币之母,它最先应用了这个行业的基础技术。 这就是为什么我认为当比特币的价格飙升时,所有其他数字货币都会随之上涨,反之亦然。 下图是比特币(绿色)和以太坊(蓝色)的价格变化曲线。

中国有正规的数字货币平台吗_正规挖矿的数字货币平台_newbibtc数字货币平台

如您所见,对应关系看起来非常准确。 但是,如果没有统计方法论依据,我们不会急于下结论。 稍后我们将详细讨论使用 Granger 因果关系检验来识别“协整对”。

因素二:显然,足以影响游戏规则的法律因素或其他技术手段也在影响着数字货币的价格。 去年9月中国禁止数字货币时,所有数字货币的价格都迅速下跌,一切都陷入了混乱。 为此,我们从 Pytrends API 获取重大事件的 Google 新闻搜索频率数据。 下图中的红色曲线显示,“加密货币”的搜索频率在加密货币价格下跌时达到峰值。

正规挖矿的数字货币平台_中国有正规的数字货币平台吗_newbibtc数字货币平台

有趣,对吧? 在这个项目中,搜索关键词是由谷歌关键词工具选择的,它不仅可以让你知道关键词的流行度,还可以提供相关关键词的列表。 使用提供的列表和 Pytrend API,我们获得了七个不同关键字的搜索频率数据。 我将在后面的章节中详细描述这些术语。

因素 3:公众认知是另一个重要因素。 你买的越多,需求就越大,数字货币的价格就越高。 很难得到这些数据,付费的 Twitter API 可以解决这个问题newbibtc数字货币平台,但因为我穷,所以我更愿意把这笔钱花在别处。 我选择了 redditmetrics.com,它提供了 Reddit 上所有子主题的历史订阅增长数据。 下面对比Nem(新经济运动,中文名称新经济货币,代码:XEM)的子主题订阅增长(橙色)和新的历史价格(蓝色)。

newbibtc数字货币平台_正规挖矿的数字货币平台_中国有正规的数字货币平台吗

正如预期的那样,订阅量的增长与价格趋势的变化之间存在高度重叠。

以上介绍只是为了让您对该领域有一个初步的了解,并向您介绍我们正在努力解决的问题。 我的 GitHub 上提供了完整的 EDA,接下来,我将介绍一种预测硬币未来价格的模型的统计方法。

如何建立模型?

在本节中,我们将深入研究该方法。 这里只是对每个步骤的总结,如果你想深入挖掘代码,请查看我的 GitHub 存储库。

1 确定协整关系对

我们可以通过 Cryptocompare API 访问 12 种主要数字货币的价格历史数据。 在我们对时间序列做任何事情之前,我们必须确保时间序列是静止的。 为满足平稳性要求,时间序列必须具有常量均值、常量方差和常量自相关。 实际上,完全平稳的时间序列是不存在的,但别担心,我们有 Dickie-Fuller 检验!

扩展的Dickey-Fuller检验是一种统计检验,可以检验自回归模型是否存在单位根(雷锋网注:单位根检验是针对宏观经济数据序列以及货币和货币等是否存在一定的统计性质提出的)金融数据系列。平稳性检验的一种特殊方法)。 测试采用自回归模型,通过不同的滞后值优化信息因子。 其中null hypothesis(根据雷锋网:Null hypothesis是做统计检验时的一种假设,内容一般希望被证明是假假设)是时间序列可以表示为一个单位根。 从统计学上讲,如果你的 P 值小于 0.05,则意味着可以拒绝零假设。 但是——同样——对于一个特定的问题,结果应该是可解释的和有意义的。 事实证明,使用 0.05 的阈值,所有 12 个硬币的历史价格都不会通过平稳测试newbibtc数字货币平台,在这种情况下,我们必须平稳时间序列并重新运行测试。

微分:这是对时间序列进行归一化的常用方法,可以消除趋势和季节性。 在这个项目中,我们区分了连续观察的差异(滞后 1)。 如果一个时间序列有季节性因素,那么滞后值应该是季节性的周期。 数字货币示例中没有明显的季节性成分。 下面的箱线图显示以太坊在一天 24 小时内的每小时平均价格相对恒定。 它们的差异各不相同,但没有明显的模式。 在对时间序列进行滞后差分后,所有 12 种货币都通过了 Dickie-Fuller 检验。

newbibtc数字货币平台_中国有正规的数字货币平台吗_正规挖矿的数字货币平台

格兰杰因果检验:这是一种统计假设检验,用于确定一个时间序列是否有助于预测另一个时间序列。 在这里,我们使用格兰杰因果检验来确定一种数字货币价格的滞后值是否可以用来预测其他货币的未来价值。

由于12种币的历史价格数据不变,我们一共构建了132组不同币种的数据对,每组数据对是一种数字货币对应其他数字货币的历史价格(注:ETH-BTC数据对与 BTC-ETH 数据对不同!)用于格兰杰因果检验。 检验的原假设是:在每个货币数据对中,后数据货币对前数据没有影响。 经过测试,我们初步发现达世币 (DASH) 与比特币现金 (BCH) 的相关性最强(即比特币现金的价格对 Dartcoin 的价格影响最大),但进一步的研究表明,这强相关性是由于来自韩国的交易激增。 考虑到这不是正常情况,我们选择了最相关的货币对 XEM-IOT。 在这个项目中,我们将使用 IOT(物联网货币)的历史价格来预测未来的价格。

2.特征选择