云基础设施工程师
DEFCON AI 是一家利用人工智能、数学优化、数据分析和软件工程,专注于复杂系统韧性优化的洞察型公司。现招聘一名资深云基础设施工程师,负责设计、部署和运维云环境,重点聚焦虚拟化、自动化与安全。
加载中...
1 )负责 GPU 超级节点新硬件的技术评估与选型标准制定,输出硬件适配路线图。
2 )主导安全容器环境中设备虚拟化的关键技术攻坚,涵盖 vSMMU 、SVA 、GPUDirect RDMA 等核心模块的研发与优化。
3 )设计并建设面向 GPU 超级节点的底层 VMM 自动化评测体系,支持性能、稳定性、安全性等多维度量化评估。
4 )支撑系统在超大规模 AI 集群中的生产级落地,确保系统具备高可用、高性能、低成本的工程优势。
5 )输出高质量系统设计文档,参与智算多租容器计算系统的底层架构评审与技术决策,推动架构持续演进。
1 )计算机科学或相关专业,5 年以上系统开发经验。
2 )精通 linux 内核和虚拟化技术,具备大规模生产系统底层技术开发上线经验。
3 )熟悉容器技术( Docker 、containerd )及容器运行时( runc 、gVisor )。
4 )具备虚拟化或轻量虚拟机( microVM )开发经验,熟悉 Firecracker 、QEMU 、KVM 者优先。
5 )具备强烈的安全意识,了解常见漏洞(如 CVE 、逃逸攻击)及防御机制。
6 )有开源项目贡献经验或技术博客输出者优先。对 AI 硬件及系统技术有深入理解,熟悉常见 GPU 卡型及相关底层技术,熟悉相关发展趋势者优先。
7 )工作中有责任心,注重团队协作,具备快速学习和动手实践的能力。
阿里云智算团队。
我们正在构建面向 GPU 超级节点架构的新一代智算多租容器计算系统,采用以 Rust 编写的轻量级 VMM 为核心的安全容器架构,致力于打造具备强隔离、低虚拟化开销、高兼容性的 AI 原生运行时环境。你将作为核心系统工程师,深度参与底层虚拟化关键技术攻关,解决安全容器在大规模 GPU 计算场景下的性能、隔离与可扩展性难题。
这不仅是一次系统级编程的挑战,更是参与定义 AI 时代安全容器基础设施标准的战略机遇。
感兴趣的可以聊一聊,负责内推,全程跟踪。
注册并登录后即可查看
DEFCON AI 是一家利用人工智能、数学优化、数据分析和软件工程,专注于复杂系统韧性优化的洞察型公司。现招聘一名资深云基础设施工程师,负责设计、部署和运维云环境,重点聚焦虚拟化、自动化与安全。
为知名客户招聘两名信息系统安全工程师(ISSE),负责网络安全体系架构、需求、设计与实施,支持防篡改、网络韧性、威胁感知以及企业级网络安全能力的集成。工作地点在马萨诸塞州 Marlborough(或 Andover、Woburn、Tewksbury),全职正式编制,需持有有效安全许可。
我们正在寻找一位资深的基础设施 / 云自动化工程师,使用企业级工具集在 AWS 上设计、构建并维护安全、可扩展、自动化的基础设施。该角色专注于操作系统配置管理、黄金镜像工程以及基础设施即代码(IaC),并与安全、平台及 DevOps 团队紧密协作,在企业级规模上交付可靠、合规的云环境。
负责对公司业务系统、网络设备、云平台及移动应用进行渗透测试与安全评估,发现潜在安全漏洞并输出报告。 模拟真实攻击场景,对目标系统进行渗透、提权、横向移动等测试,验证安全防护有效性。 对扫描和测试发现的漏洞进行验证、分析与复现,并提供修复建议。 参与应急响应,协助分析和溯源安全事件。 跟踪最新安全漏洞、攻击技术与安全工具,并进行内部技术分享。 协助开发团队与运维团队