Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

控制论与编程
正确的文章链接:

分布式高负载系统中的监控和故障排除

Rudometkin Vasilii Andreevich

MTS PJSC地理定位服务开发专家

109382, Russia, Moskva oblast', g. Moscow, ul. Krasnodonskaya, 36, kv. 120

vasiliy.rudometkin@gmail.com

DOI:

10.25136/2644-5522.2020.2.32996

评审日期

26-05-2020


出版日期

10-08-2020


注解: 该研究的主题是分布式高负载系统中的监控和故障排除问题。 描述了设计和开发中最常见的错误,预测方法和解决方案。 在本文中,作者从开发人员的角度描述了当前在高负载系统开发中使用的最流行的工具以及使用它们时的主要错误。
本文介绍了一套工具,其实现可以显着减少搜索漏洞的时间,描述了选择一套度量技术的困难-ELK/EFK,描述了它们的优点和缺点。 详细分析了所用工具的类似物。 工作中的主要结论是:
-需要从项目开发开始就开发系统监控基础设施,因此可以在项目开发阶段纠正项目的高复杂性。
-有必要使用最流行的工具,其中有大量的信息在开源,例如,在互联网上。 这种方法将减少纠正可能由一组特定工具引起的错误的时间。
-该公司不需要节省高素质的人员,这在未来将节省大量的时间在修复问题,减少时间来开发新的功能,并允许您投入最少的时间来支持和测试已经开
-在分析问题时,值得关注的是其他公司很可能已经解决了类似问题的公共资源。 例如,facebook长期以来一直在处理监控问题,并开发了大量工具来解决这个问题。 他们还收集了大量的系统记录,允许您在任何情况下分析系统的行为。


出版日期:

监察工作, 监察工作, 高负荷系统, 高负荷系统, 量度数据, 量度数据, 麋鹿, 麋鹿, EFK公司, EFK公司, 白盒, 白盒, 黑盒子, 黑盒子, 测试, 测试, 品质控制, 品质控制, 建筑设计, 建筑设计