职位描述:
岗位职责 1针对大语言模型LLM的微调涵盖全参数微调以及LoRA/QLoRA等参数高效微调技术 2负责模型评估与测试并构建自动化测试流程优化训练流程利用DeepSpeedFSDP等分布式训练技术提高训练效率 3研究最新的对齐技术DPORLAIF以优化模型的交互体验和响应质量 4开展对比实验分析不同模型架构数据规模优化策略的影响并制定相应的优化方案 5参与MLOps工作支持模型部署推理优化如INT4/INT8量化服务化FastAPI/Triton 岗位要求 1计算机科学人工智能机器学习等相关专业硕士及以上学历应届生亦可 2熟练掌握深度学习框架PyTorchTensorFlow熟悉Transformers库Hugging Face 3具备大模型微调经验了解LoRA/QLoRAPrefix TuningP-Tuning等参数高效微调方法 4熟悉数据标注数据清洗等数据处理技术掌握NLP数据增强方法 5掌握常见的LLM 评测方法包括人工评测GPT-4评分自动评测BLEUROUGE等 6熟悉分布式训练了解DeepSpeedFSDPMegatron等技术 7具备工程思维能编写高效的数据处理训练测试代码并优化计算资源
岗位职责 1针对大语言模型LLM的微调涵盖全参数微调以及LoRA/QLoRA等参数高效微调技术 2负责模型评估与测试并构建自动化测试流程优化训练流程利用DeepSpeedFSDP等分布式训练技术提高训练效率 3研究最新的对齐技术DPORLAIF以优化模型的交互体验和响应质量 4开展对比实验分析不同模型架构数据规模优化策略的影响并制定相应的优化方案 5参与MLOps工作支持模型部署推理优化如INT4/INT8量化服务化FastAPI/Triton 岗位要求 1计算机科学人工智能机器学习等相关专业硕士及以上学历应届生亦可 2熟练掌握深度学习框架PyTorchTensorFlow熟悉Transformers库Hugging Face 3具备大模型微调经验了解LoRA/QLoRAPrefix TuningP-Tuning等参数高效微调方法 4熟悉数据标注数据清洗等数据处理技术掌握NLP数据增强方法 5掌握常见的LLM 评测方法包括人工评测GPT-4评分自动评测BLEUROUGE等 6熟悉分布式训练了解DeepSpeedFSDPMegatron等技术 7具备工程思维能编写高效的数据处理训练测试代码并优化计算资源
