• 回答数

    6

  • 浏览数

    223

shenleireg
首页 > 职称论文 > 两篇论文入坑aiops异常检测

6个回答 默认排序
  • 默认排序
  • 按时间排序

司令来拉

已采纳

AIOps,顾名思义是将AI赋能于IT运维管理。国际权威咨询机构Gartner在2016年的报告里首次提出AIOps的概念。

传统的IT运维工作,大多是借助监控软件查看数据,并依赖运维人员的经验进行根因定位和排障。有了AI的加持后,可以借助AI算法提前发现数据中的异常,并通过数据串联锁定可能根因,大大缩短故障处理时间、提高运维效率。

经过多年来的发展,越来越多的大中型企业投入智能运维AIOps的部署,以应对企业数字化转型带来的数据量暴增、系统架构复杂带来的运维挑战。

Gartner在其2022年的AIOps报告中也指出:Yes, There is no doubt: There is no future of IT operations that does not include AIOps. 毫无疑问,不包含AIOps的IT运维不会有未来。

相信在不久的将来,传统运维将渐渐被智能运维AIOps所替代。

通常,AIOps智能运维系统包含这几个功能模块:

268 评论

Lemonice柠檬冰

这是因为目前,IT运维管理面临着两难境地的巨大挑战,一方面要降低成本,另一方面其复杂度又不断攀升。主要体现在数据量巨大、数据类型繁多和数据生成速度快三个维度:

如何通过AIOps手段增加运维效能和降低运维成本,对于企业来说都是很大的挑战。而致力于智能运维AIOps领域的擎创科技,已经为国内多家银行和证券用户成功部署夏洛克AIOps平台,助力企业运维降本增效:

目前,AIOps主要用于IT运维,且在企业中日益占据主导地位,而一些成熟的组织已正在利用该技术为企业领导者提供决策支撑。企业基础设施与运维负责人应该尽早启动AIOps平台部署工作,优化当前的性能分析,并在未来两年至五年内扩展至IT服务管理和自动化领域。

301 评论

大琳琳666

目前,AIOps平台产品可以分为两种方式:与领域无关的解决方案和以领域为中心的解决方案。Gartner预计,在未来五年中,与域无关的广域AIOps平台和以域为中心的窄域AIOps工具(如ITIM,APM或ITSM套件)将成为交付AIOps功能的两条途径。在中国,许多供应商提供了广泛的AIOps功能,比如强大的APM背景的公司,这些公司可以利用他们的应用程序监视见解来构建AIOps产品,中国应用性能管理(APM)行业领军企业听云就是此类供应商之一。听云可为客户提供更加优质的、成熟的智能运维解决方案,紧跟技术发展趋势,将AIOps能力与APM产品高效融合。

181 评论

薄荷点点

智能运维即是AIOps,根据Gartner最新解释,指整合大数据和机器学习能力,通过松耦合、可扩展方式去提取和分析数据量(volume)、种类(variety)和速度(velocity)这三个维度不断增长的IT数据,进而为IT运维管理产品提供支撑。运维发展至今,Ops已经从手工运维、流程化标准化运维、平台化自动化运维,来到了DevOps。近几年,Ops已经和大数据、AI融合,延伸出DataOps、AIOps。这是历史必然,也将为企业IT运维带来极高的效率,对于企业而言。AIOps意味着效率更高、成本更低、解决时间更短。对比于传统运维工具,AIOps的优势非常明显:传统运维工具的指标采集维度过于单一,在判断故障时,会通过非常多的运维指标进行排查,这样会造成时间的浪费,对于传统运维数据更多的是依靠专家经验判断;而AIOps可以通过底层的大数据平台进行分析,通过AI技术的充分学习判断,对告警进行直接的溯源、降噪,第一时间对运维人员展示故障的根本原因及定位,大大提高了工作效率和处理故障的时间。

94 评论

宇宇酱ovo

在搭建服务器时,除了部署webapp之外,还需要服务的异常信息与服务器性能指标进行监控,一旦有异常则通知管理员。 服务器使用Linux+搭建的。 编写脚本检测错误日志和服务器性能指标,一旦新生错误日志或者性能降低到设定的阈值时,则使用云监控将报警上传到云账号。服务运行监控错误日志包含以下三个方面:nginx 错误信息监控(配置) ${NGINX_HOME}/logs/ 错误信息监控(配置) ${TOMCAT_HOME}/logs/错误信息监控(log4j) ${WEBAPP_HOME}/log/error

162 评论

条野太浪

AIOps如何落地,还是以具体案例来说比较容易理解。就拿擎创为北京农村商业银行做的项目来说。

项目背景:

近年来数字化转型的步伐愈发变快,随着北京农村商业银行业务规模的扩增以及业务形式的电子化加速,贯穿业务、市场、系统、应用、数据库、中间件、网络、安全等多方面的数据量迅速叠加堆积。然而,这些对于市场而言极具价值的巨量化数据并不集中,它们分散在银行的各中心服务器或设备之中,这使得银行的数据运维工作量越来越大,尤其是在日志的统一管理、监控、信息挖掘等方面极为明显。因此,北京农村商业银行对于信息技术提升和数据管理加强的需求日益加深。

根据监管部门对银行数据治理的相关指引以及中国银监会《商业银行信息科技风险管理指引》(银监发〔2009〕19号)中针对日志文件完整性、存留周期的相关要求,北京农村商业银行最终选择擎创科技助力其完善智能运维建设,保障其业务的平稳高效运行。

解决方案:

根据北京农村商业银行的需求以及现状,擎创科技通过以下手段为其建设运维大数据平台。

创新点:

北京农村商业银行在运维大数据平台项目的建设中,采用流批一体的处理技术、流式窗口聚合方式,实现了实时采集、秒级处理、秒级查询,为运维人员提供高效的数据查询手段,为应用人员实现交易数据与日志的深度结合;

采用智能算法判断、故障根因定位,为运维人员提供便捷数据分析工具。充分挖掘了北京农村商业银行的运维数据价值、提升了运维管理水平、提高了运维效率。

建设成效:

建设日志治理平台和大数据平台,实现日志数据统一集中管理、KPI动态异常检测、日志智能聚类等功能。

日志治理+大数据平台(算法),当前日增日志6TB,设计容量10TB,热数据保存30天、冷数据保存3个月,大数据平台日志存档一年、指标类数据两年;

最高峰每秒处理日志500万条日志,其中最高按单笔业务交易日志行数达3000+行,经采集、数据提取、数据合并、数据丰富等数据处理后延时小于1s。

总结:

随着运维大数据平台的建设完成,北京农村商业银行实现了对各类运维日志数据的统一管理,能够对日志进行集中查询、聚类分析、快速分析、精细化分析等操作,结合监控告警的智能化处理,可以做到事前智能预警、事后快速定位故障并分析,进一步提升了银行数据中心的运维管理水平。

328 评论

相关问答

  • 异常检测最新论文

    计算机网络安全就是通过利用多种技术、手段、 措施 ,保证网络系统的安全运行,确保网络传输和交换过程中数据的完整性、保密性和可用性。下面是我给大家推荐的计算机

    xiamisally 1人参与回答 2023-12-06
  • 图像异常检测论文csdn

    改进基于深度学习的图异常检测方法:1. 使用复杂的模型:使用更复杂的深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)或变分自编码器(VAE)等,可

    天天天晴9080 4人参与回答 2023-12-11
  • 异常入侵检测论文

    入侵检测技术论文篇二 浅析入侵检测技术 摘 要 入侵检测系统是一个能够对网络或计算机系统的活动进行实时监测的系统,它能够发现并报告网络或

    洛雪吟风 2人参与回答 2023-12-07
  • 异常点检测论文

    论文中异质性检验是什么介绍如下: 异质性一般指meta分析中,纳入文献之间的存在的异质性。其广义定义为:描述参与者、干预措施和一系列研究间测量结果的差异和多样性

    小皮球佳佳 3人参与回答 2023-12-09
  • 异常检测论文

    1 . Yin,B.Q., Li,Y.J., Zhou,Y.P., Xi,H.S.,Semi-Markov Decision Problems with Dis

    redfishchy 3人参与回答 2023-12-09