1、理解数字内容领域运营营销等业务场景问题并规划大模型技术解决方案、包括数据处理、模型调优、效果测评等; 2、使用各类大模型优化技术,针对性优化在业务场景中的大模型效果 3、使用知识增强、外挂及数据优化等技术,缓解AI幻觉问题,提升模型精准性 4、针对业务需求,持续拓展大模型多模态能力,解决业务场景问题提升业务价值
1.计算机、数学或统计学相关专业的硕士及以上学历,精通PYTORCH、TENSORFLOW等至少1种深度学习框架,具有3年以上算法相关工作经验 2精通ATTENTION、TRANSFORMER及其变型,能熟练应用pre-train、PEFT、SFT、RLHF、LORA等各种优化技术 3.熟悉业界领先的大模型,包含但不限于GPT、LLAMA、GLM、BLOOM等,对DEEPSPEED、MEGATRON-LM有一定了解和使用经验 4.在文本图像生成、prompt工程有优质论文或开源项目产出者优先