核心技术方向与工作内容
1. 数据治理与模型训练
- 负责多模态数据(PDF/图片/录像)的采集与清洗,使用自动化清洗工具与机器学习库,修复噪声数据与标注错误。
- 基于 Unsloth 和 Llamafactory 框架,采用 LoRA/QLoRA 技术对千亿参数大模型进行轻量化微调,适配特定领域垂类场景。
- 优化混合精度训练策略,通过多GPU梯度累积提升训练效率,支持模型增量更新与动态迭代。
2. RAG知识库构建与应用
- 搭建特定领域的RAG系统,整合行业内资料,文本,实现语义检索准确率≥95%。
- 优化混合检索(关键词+向量),结合知识图谱增强答案可解释性。
- 设计分级存储策略(热数据/冷数据),管理TB级数据,支持实时检索与动态更新。
3. 模型部署与功能整合
- 使用 FastAPI封装模型API,对接其他系统模块,实现功能。
- 训练与微调图像模型与视频模型,满足不同场景下的需求。
- 使用运维监控工具(如Prometheus,Grafana),追踪API响应延迟、GPU利用率等核心指标,保障服务稳定性。
---
硬性技能要求
技术能力
- 编程与框架:
- 精通 Python,掌握 FastAPI/Django框架,能独立完成RESTful API开发。
- 熟练 PyTorch 与 Transformer 架构,深入理解 LoRA/QLoRA 微调技术。
- 熟悉数据采集,数据清洗与预处理,掌握数据标注工具。
- 工具与流程:
-熟练使用vLLM,SGLang,Ollama等部署工具。
- 熟练使用 Hugging Face 生态与 Unsloth/Llamafactory 训练框架。
- 掌握 Docker 基础运维,能解决驱动兼容性与环境依赖问题。
- 熟练使用Dify的功能,能够编写工作流。
- 了解RAG全流程(em
- 2年以上AI项目或大数据项目经验,至少1个大模型微调与部署案例(需提供过往作品证明、代码或文档)。
- 熟练掌握网络编程、机器学习算法、模型的基本原理,行业内前沿知识。
- 加分项:
- 了解教育信息化标准,熟悉教务系统(如强智/青果)或具备教师资格证。
- 有知识图谱构建经验(如学科知识点关联分析)。
- 掌握前端vue3框架,熟练使用AntDesignX、 Element Plus组件库。
- 了解MCP开发协议。
---
拒绝项
❌ 仅停留在算法理论,无实际微调或部署项目(需提供代码/日志)
❌ 无法独立完成API开发,不会使用Python的web框架
❌ 对教育业务场景(如学情分析逻辑)缺乏基本认知。
Copyright C 2013-2025 All Rights Reserved 版权所有 长春才库招聘
吉ICP备13005098号-13
吉公网安备22017302000466号
地址:长春市高新区阳光硅谷大厦D座1107室 EMAIL:214401241@qq.com
ICP经营许可证:吉B2-20210352 人力资源证: (吉)人服证字【2015】第0113000213
Powered by PHPYun.