1、利用Diffusion类AIGC技术进行智能创作,如视频生成、音乐生成,形成多样化高质量的多模态创作内容; 2、负责llm/mllm的建设和落地,不限于SFT、Prompt、RAG、Tools等,应用于Agent落地和AI玩法创新; 3、负责音视频内容理解体系的建设和研发工作,包括类目/属性/质量/关键词等音视频标签; 4、负责公司人工智能科创领域前瞻性技术研究,跟踪AIGC/MLLM方向的最新技术,跟进业界SOTA模型并迅速产品化落地,给出业界最佳解决方案并保持技术领先。
1、博士研究生学历,对CV、多模态、AIGC等相关领域有深入的理解,在其中一个或多个方向有深入的研究经历,且有相关实际项目经验; 2、熟悉LLM/MLLM/VLLM等大模型技术优先;熟悉Diffusion+ControlNet类生成技术优先;有语音算法经验者优先,如tts、asr、分类、歌曲生成等; 3、有责任心,乐于沟通,优秀的业务sense; 4、有良好的数据敏感性;有分析和解决问题的能力;善于学习新事物; 5、发过高水平会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、SIGIR、ACL、PAMI等发表过论文或有竞赛经验者优先。