过去一年对许多IT团队都是波澜壮阔的一年。面对诸多挑战,云成本持续上升,对优化云开支的压力愈发显著。
同时,在数据管理和监控领域,尤其是在那些不断扩张的组织中,数据量出现了集体性的激增,导致对跨多云和本地环境的数据管理和监控需求急剧提升。
2023年,可观测性崭露头角,对解决数据管理混乱发挥了关键作用。不过,随着数据规模的激增,可观测性也面临一些潜在的问题亟待解决。Telemetry数据(包括日志、调用链和指标)的增多为降低云成本、优化冗余以及预测和解决业务相关的IT问题提供了基础,但遥测数据规模的庞大也为数据管理增加了更多的复杂性。
尽管可以通过开源工具自行整合这些数据,但越来越多的公司更愿意找到一个现成的一体化平台,以整理数据并形成可视化结果。2023年的经济压力使降本增效成为所有人的关注焦点,在可观测性上过度支出的前车之鉴唤起了企业对性价比和灵活定价方案的需求。
标准化的推动有助于处理庞大的遥测数据,包括大语言模型(Large Language Model,LLMs)在内的人工智能(Artificial Intelligence,AI)和机器学习(Machine Learning,ML)的出现,为高效利用可观测性数据的激增提供了希望。
展望2024年,我们期待机器学习在解析可观测数据方面发挥更为可靠的作用,减轻人工分析的负担。
▍可观测性演进超越传统监测的多维实践
由于不断涌现的工具和最佳实践,可观测性已经超越了传统意义上仅用于发现错误和解决故障的监测范畴。它融入了不同的平台和工具,呈现出更强大的开放性和兼容性,为预测贡献了独特的价值。
其中,预测的内容包括故障前、成本变动、资源使用等难以提前处理,具有较大试错成本的问题。面对越来越复杂的微服务应用程序,企业可以采用包括塞讯业务观测平台在内的一体化平台收集可观测数据,快速解决可观测性领域的监测难题。另外,开发人员还可以充分利用起平台不断增强的自动监测功能,无需再为修改可观测性平台的监测代码而烦恼。
然而,工具的多种选择也可能带来一些麻烦,工具滥用和数据孤岛在2023年形成了重大困扰。公司不再为获取正确的数据而苦恼,反而为数据的激增而烦恼,存储数据的成本不仅非常高昂,“大海捞针”的过程也变得越来越困难。
因此,可观测性的实际应用正朝着堆栈上游的方向发展,从关注日志、指标和其他信号的集中式收集,转向从基础设施和应用程序、信号类型、来源和格式等多方面的数据中提取所需的信息。为满足这一需求,包括塞讯在内的可观测性平台供应商正在转向提供一体化可观测性解决方案,并加强数据分析后端的能力。
▍2024:安全攸关与智能观测的双向挑战
2023年,攻击事件的激增导致了漫天的罚单和解雇通知,对于高度分布和结构复杂的Kubernetes来说,安全性仍然是一个严峻的问题。预计这种情况将在2024年持续出现。
在过去的一年中,eBPF已经成为开源安全工具的基石,为防范攻击提供了强有力的可观测支持。eBPF与Linux内核密切相关,其有效性主要源于卓越的计算效率。然而,把eBPF仅视为Linux内核的工具是不够全面的,它能够通过钩子(hook)扩展到堆栈上使用。通过eBPF平台,DevOps团队能够监控Kubernetes集群的运行状况,在违规和安全威胁出现时提供直接可操作或建议性的措施。
在处理Telemetry数据的激增时,选择合适的工具非常重要。可观测性平台能够展示关键指标,改善业务决策,减少IT部门不断增长的预算压力,降低云成本。2023年,大语言模型和人工智能开始发挥革命性的作用,我们看到了AI以超越人类的计算和分析能力,在小范围内引发的化学变化。
大语言模型将成为DevOps团队、安全工程师和SRE的“合作伙伴”,通过分析单一流的日志、指标和调用链数据,发掘那些“未知的未知(unknown unknowns)”的信息,使数据分析变得更强大。
大语言模型可以随时随地接收传入的信息,主动提出优化建议,帮助工程师快速解决问题,将业务影响降到最低。它密切关注DevOps、IT和业务部门的庞大、复杂且难以想象的运营数据流,还将为我们提供自动执行日常管理任务所需的代码,使人类能够专注于为这些自动化策略设定限制条件。
▍塞讯助力可观测性长足发展
在面对IT领域的巨大挑战时,可观测性凭借其引领地位,成为解锁数据爆炸智能应对的关键。2024年,塞讯业务观测验证作为一体化平台,将为企业提供了切实可行的解决方案,使可观测性的实际应用更加顺畅。
塞讯业务观测验证致力于助力企业解锁数据的潜力,降低成本,提高IT效率。展望未来,我们将继续保持可观测性的发展,为您提供更优质、智能的可观测性服务。