当前位置:
为Z银行AI实验室打造基于GPU虚拟化技术的人工智能平台
来源:公司项目 | 作者:源予科技 | 发布时间: 2024-09-12 | 820 次浏览 | 分享到:
项目背景

Z银行于2018年创立银行业首个AI实验室,目前对人工智能的研究已经涵盖自然语言处理、生物识别、机器学习、大数据等多个领域,并在支付、风控、营销、消费金融等诸多应用场景下进行实践。

业务挑战

随着AI在金融科技领域的广泛应用,金融机构对AI的依赖度逐渐增强,覆盖营销、风控、智能识别、智能客服和量化交易等核心业务流程。这种依赖对服务连续性、业务响应速度和运营成本收益比提出了更高的要求。特别是在AI应用迅速扩展的背景下,GPU资源的紧张问题日益凸显,如何高效利用和管理这些资源成为AI在金融行业全面推广的关键挑战。

同时,考虑到AI在风控、投研、防欺诈和智能客服等关键业务中的核心作用,金融机构对平台的高可用性和容灾能力提出了严格的标准。不仅要求平台能够在正常业务场景下稳定运行,还需要具备快速恢复和应对突发情况的能力。

此外,随着AI应用的广泛部署,如何确保资源使用效率,避免资源浪费和成本超支,也成为金融机构面临的重要议题。

解决方案

通过利用源予的GPU虚拟化技术和标准化产品,Z银行AI实验室成功构建了一个基于GPU虚拟化技术的人工智能平台;


   • 通过GPU虚拟化技术,将单张GPU卡进行碎片化切分,并按照业务需求灵活调度给不同的应用程序使用。这有效避免了应用程序长时间独占GPU,提高了GPU卡的利用率,使得GPU资源利用率提升30%至50%。

    • 该平台能够统一管理深圳、上海两个不同地点的三个中心机房的服务器,并通过应用调度策略,如节点标签、亲和性等配置来完成应用的多中心发布,从而实现了关键应用的多活或主备容灾部署。

    • 通过将平台和K8s集群直接运行在裸金属服务器上,避免了传统虚拟化技术带来的性能损失,保证了在保障应用程序性能的同时,提高了CPU计算资源的利用率。

    • 该平台还具备按天为单位频率的上线能力,并保证生产环境资源的充分利用和应用的高可用性要求。


此外,协助Z银行制定了平台使用规范,并且提供平台实施、应用迁移、应用安全加固及详细的云原生相关技术培训,同时为Z银行运维人员定制了相关功能组件,使平台操作更符合Z银行的运维流程和规范,以提供更好的使用体验。