在一次Java Web应用程序的优化升级过程中,从Tomcat 7.0.109版本升级至8.5.93版本后,尽管在预发布环境中验证无误,但在灰度环境中却发现了一个令人困惑的问题:新日志记录神秘“失踪”。本文深入探讨了这一问题的排查与解决过程,揭示了由Tomcat升级引发的不寻常日志记录故障背后的技术细节。
近来,随着大型语言模型的发展,视觉语言大型模型的能力也在逐步增强,GPT-4[1]、Gemini Pro 1.5[2]和Claude 3[3]等著名的闭源模型成功将 LLM 扩展到视觉语言模型领域。LLaVA[4],InternVL[5]等开源模型也在迅速发展。目前,视觉语言模型领域存在一些关键问题亟待解决:1)闭源模型很少公开关于其架构的详细信息。相比之下,开源模型虽公开了其训练策略,但这些策略的详细消融并没有完全披露。2)在目前的开源工作中,对于预训练阶段,大多都是凭经验添加不同来源的数据集,这使得预训练过程难以得到深入的探索。3)在微调阶段,绝大多数工作关注的重点通常是添加和消融更多的数据集,这样性能会较快触及瓶颈。我们针对以上几点给出了我们的方案,并进行了清晰充分的实验论证。
从23年开始,我们团队开始前端错误监控方向的开发。经历了一些列的迭代和发展,从监控SDK、上报、数据治理、看板集成、APM自研可视化初步完成了一条完整且适合B站前端监控。 截止目前(2024.08.01),前端监控在B站85%以上的业务线,1700+项目中运行。今年初APM平台的落地接入了210+的项目,5月新推出的一键告警配置功能也达到了300+。
在当前大模型快速发展中,编程技术成为了许多企业争夺的焦点领域之一,通用大模型的发布往往伴随着诸如HumanEval等测试基准来衡量模型在编程领域的性能。此外,OpenAI CEO 萨姆·奥特曼多次在公开场合强调,最期待的大模型应用场景是如何在代码生成和编程效率提升领域实现真正的质变。这一观点背后不仅是技术专家对编程的深厚兴趣,更深层次地反映了AI商业化潜力、模型在实际应用中的广泛可能性,以及对未来市场格局的战略考量。
数据库是互联网的基石,存储着海量信息,使信息可被高效地组织、检索和分享。没有数据库,网站无法记忆用户数据,应用无法提供个性化服务,信息交流将失去智能与连贯性。因此,数据库技术极大地推动了互联网的发展,是连接用户与信息、构建动态交互网络世界的桥梁。 本文将深入探讨应运而生的多种数据库类型,从传统的层次、网状、关系型数据库到现代的列存、文档、键值、图以及时序数据库,乃至新兴的HTAP数据库,揭示了它们各自的设计理念、技术特点、应用场景及局限性。
“人月神话” 这个词,你知道是什么意思吗?我的第一反应是当面阿姆斯特朗在月球上留下的人类的一大步。然而实质上,这是一本软件工程的经典书籍,它最大的影响是让 “人月” 这个概念传遍整个软件工程行业。然而,如此经典书籍,完全阅读过的人不多,前段时间笔者陷入了软件项目如何管理好的思考中,于是拿起此书,略读一番,留下本读书笔记,以及自己的感想。