岗位职责:
1.负责图像、视频等多模态内容的理解与建模,围绕CLIP、Qwen-VL、DeepSeek-VL 等主流大模型进行预训练、微调与推理优化,提升模型在业务场景中的适配性、精度与性能。
2.深入理解客户需求,结合实际业务数据,设计并实现高效的算法方案,推动AI模型在图像识别、视频分析等场景中的产品化落地,保障模型的可用性与稳定性。
3.持续跟踪多模态视觉理解、跨模态对齐、视觉语言融合等方向的前沿研究,主导新技术的选型、原型验证与落地转化,形成差异化技术壁垒。
4.使用PyTorch等深度学习框架进行算法工程实现,支持模型在多种计算平台的部署与性能优化,提升系统整体运行效率。 5.撰写高质量技术文档、专利与论文,推动团队技术能力沉淀与复用。
任职要求:
1.计算机科学、机器学习和人工智能等专业硕士,5年及以上实战经验
2.有实际视觉或多模态深度学习算法研发经验
3.熟练掌握PyTorch,具备模型构建、训练、调试、性能优化等全流程能力,有Transformer结构实践经验优先
4.熟练掌握Linux开发环境,熟悉CV及常用视觉算法,具备较强的算法实现与工程调优能力
