Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

软件系统和计算方法
正确的文章链接:

各种类型的老虎机在放置游戏条件下的适当行为分析

Dimitrichenko Dmitriy Petrovich

博士学位 技术科学

应用数学与自动化研究所研究员

89a Shortanova str., Nalchik, 360000, Russia, Republic of Kbr

dimdp@rambler.ru

DOI:

10.7256/2454-0714.2024.4.72488

EDN:

SQCVFI

评审日期

27-11-2024


出版日期

05-12-2024


注解: 这项工作的研究对象是具有目的行为属性的自动机的同质集体。 本研究的主题是在实施放置游戏条件时对此类机器的不同设计进行比较。  本研究的目的是量化自动机的惯性属性和记忆深度值对放置游戏框架内自动机集体功能有效性的影响。 在所考虑的集体中,自动机在给定的栖息地中以不同程度的有效性执行动作。 自动机根据其设计,用另一个动作对输入信号作出反应。 对自动机有效性的评估定义为自动机在所考虑的时间段内接收到的正信号或负信号的总和。 这个特性既取决于机器的声明设计,也取决于它的内存深度。 有必要确定最简单的自动机设计,以最短的方式在给定环境中实现最佳效率。 环境属性和自动机动作的形式化以及所得结果的处理都是使用博弈论的装置进行的。 在这种情况下,机器功能的有效性值表示为老虎机玩家的累积奖金和损失金额。 所进行的研究的新颖之处在于构建对自动机集体行为有效性的整体评估,这使我们不仅能够追踪集体的愿望,以尽量减少奖励数量,而且还可以最大限度地减少集体内部竞争。 所获得的结果使得可以追踪以适当结构形式实施的自动机惯性质量对给定环境中功能效率的影响,并以放置游戏的形式正式化。 具有线性策略的自动机和Krylov自动机构成了接近最优的自动机策略的两个边际实现。 第一个是由于改变动作的高速度,第二个是由于长时间停留在接近最佳的状态。 所获得的结果的应用领域是使用最简单的自动机设计进一步研究更复杂的动态环境,因为在计算实现过程中的同步自动机集体很难并行化,当动态环境的结构变得更加复杂或这些优化任务增加时,会导致时间和计算成本显着增加。


出版日期:

一个同质的自动机集体, 适当的行为, 奖励措施, 罚款, 强化学习, 机器, 内存深度, 博弈论, 最佳策略, 安置游戏