Stuart的MATLAB视频

观看并学习

根据数据大小选择算法。

今天,我们将进一步研究Cypher算法,特别是该算法的随机性。有两种不同的分布需要查看:单个数字的分布(1,2,3,4)和Digrams的分布([1,1],[1,2],[1,3],[2,1],[2,2],…)。首先尝试是生成随机值的整个序列,然后进行这些分布计数。这很容易实施。但是,当随机值的数量必须超过10亿美元时,立即将很多记忆保持在记忆中会影响性能。提出了另一种方法。尽管此方法较慢(稍微),但它可以更好地缩放,并且可以处理第一个算法失败的计数。这里的一般课程是,当您处理大型数据集时,如果您不需要一次将其全部存储在内存中,则可能需要一定地将其进行。

|

注释

要发表评论,请单击这里登录您的数学帐户或创建一个新帐户。