人工智能专业级开发者认证考试大纲
 认证项目 人工智能专业级开发者认证
HCCDE-AI
考试名称 人工智能专业级开发者认证-理论考试 人工智能专业级开发者认证-实验考试
考试语言 中文
试题类型 判断题、单选题、多选题 操作题
考试时长 90min 480min
通过分数/总分 60/100 70/100

 

 

认证介绍

 

该认证面向人工智能领域的算法工程师、AI架构师、数据工程师、AI应用开发工程师,对华为云AI相关技术栈(如ModelArts Studio、盘古大模型等)的核心架构与实现原理进行深度技术剖析,结合实际行业场景需求(如智能制造、智慧医疗、智能金融等)对数据处理与特征工程、AI模型开发、模型微调与部署、模型性能优化、AI系统架构设计、AI应用开发等内容进行全面详细的讲解,并通过实验操作提供实践指导。

 

获得该认证可有效证明您具备以下能力:

l  面了解人工智能理论体系与技术演进的全景,把握行业发展趋势;

l  全面掌握人工智能领域核心知识,深入理解华为云AI技术栈(如ModelArts Studio平台架构、盘古大模型核心原理等)的核心架构与关键技术;

l  掌握MAASModelArts site以及ModelArts Studio工具链架构设计与关键技术,为实际开发提供技术支撑;

l  具备根据不同行业业务场景需求,利用华为云AI工具与平台进行AI模型设计、开发及落地应用的能力;

l  掌握AI训练数据的处理方法、特征工程技巧,能够根据业务需求选择合适的数据预处理方案与特征提取策略;

l  熟练进行工业级视觉模型训练与实战部署,如盘古视觉大模型-物体检测实践;

l  开展千亿参数NLP大模型训练与行业微调实践,包括DeepSeek模型的微调SFT/Lora和蒸馏操作;

l  具备对AI模型(包括大模型)进行性能分析、深度优化(如推理加速、模型压缩等)及效果调优的能力;

l  能够开发知识增强型(RAG)解决方案,通过KooSearch构建知识库问答以及结合Dify实现智能问答。

 

考试内容

HCCDE-AI认证考试包含数据工程、模型工程、应用工程等方面的知识与技能,涉及数据处理、模型开发与部署、应用构建与优化等核心内容。具体涵盖人工智能理论、AI工具链架构与技术、数据导入、加工、合成、标注、评估、管理、配比、发布,模型方案设计、训练、推理、验证、部署,以及提示词构建、RAG应用、知识库管理等工作任务的相关知识点。 

 

理论考试知识点占比

内容 占比
人工智能理论体系与技术演进全景解析 33.2%
AI 工具链架构设计与关键技术 27.8%
数据清洗、合成与配比的理论框架与核心技术解析 5.6%
工业级视觉模型训练与实战部署 11.1%
千亿参数 NLP 大模型训练与行业微调实践 16.7%
知识增强型(RAG)解决方案开发与实践 5.6%

 

 

理论考试知识点

l  人工智能理论体系与技术演进全景解析

n  了解人工智能的概念、应用场景,学习AI的子领域

n  了解人工智能领域的当前趋势、人工智能技术演进历程、关键节点与技术突破,明晰从基础算法到大模型的演进路径

n  了解CV领域的最新进展和新兴趋势

n  理解视觉语言模型(VLM)是如何集成视觉和文本信息,以增强支持图像字幕、视觉问答和多模态推理等任务

n  了解华为在大规模AI模型方面的贡献以及解决方案

n  理解提示工程和优化的概念,以利用大型语言模型的功能

n  理解监督微调(SFT)的概念、SFT的数据准备技术、SFT的训练和评估方法以及盘古模型开发与微调

n  理解预测模型的基本原理及其在人工智能中的作用

n  识别不同类型的预测模型及其应用场景

n  理解华为在预测建模与人工智能创新领域的方法论

 

l  AI工具链架构设计与关键技术

n  理解华为AI平台(MAASModelArts site)及ModelArts Studio工具链的整体架构,包括数据管理、模型训练、部署等模块的功能与关联

n  理解工具链在人工智能开发中的定位,及其在数据处理、模型训练、推理优化等环节的作用

n  掌握不同工具的适用场景,能根据任务需求选择合适的工具

n  理解工具链的性能优化机制,如资源调度、并行计算等技术

 

l  数据清洗、合成与配比的理论框架与核心技术解析

n  掌握基于自定义格式转换框架,以及将第三方数据集转化为模型可用标准格式的方法

n  理解文本、视频、图片数据加工技术的原理,包括文本提取、过滤、质量评估、特征提取,视频镜头拆分、裁剪、字幕识别、质量评估,图片图文提取、元数据过滤、鉴黄评分等,以及各种处理算子的工作原理和应用场景

n  掌握自定义算子的开发规范、集成方式、生命周期管理机制,以及在数据加工任务中的调用方法

n  理解任务流概念和算子编排原则,能根据业务需求设计合理的算子流程

n  掌握合成指令的创建、调试技巧,能根据业务需求设计有效合成指令实现数据合成

n  理解文本数据合成的原理和方法,如基于规则或模型的合成,以及利用预置或自定义合成指令进行文本合成

n  理解各种文本标注类型的定义、应用场景、标注方法和质量控制措施,如单轮问答标注、多轮问答标注等

n  掌握团队标注的组织架构、角色划分、任务分配策略、标注流程管理,以及提高团队标注效率和质量的方法

n  掌握视频、图片数据标注的类型、标注流程、质量评估标准,确保标注准确性和一致性

n  理解文本、视频、图片评估的指标体系、评估方法和模型应用,能根据评估结果优化数据质量

n  掌握评估标准的制定、编辑、查阅和删除方法,以及评估任务的创建、执行、结果管理和可视化展示流程

n  掌握数据血缘的概念、作用、追溯方法,能通过数据血缘关系进行数据集全生命周期管理和问题溯源

n  理解数据标签的分类、设计原则、应用场景,能利用数据标签进行数据集分类管理和快速检索

n  掌握文本、图片数据集配比的原则、方法,理解配比对模型训练的影响

n  掌握不同模型训练类型对应的数据格式要求、发布渠道选择策略,能根据模型需求准备和发布数据

n  掌握数据集拆分的原则、方法,如训练集、测试集、验证集的划分比例和策略,以及数据胶囊的概念、使用场景和操作方法

 

l  工业级视觉模型训练与实战部署

n  理解工业级视觉大模型的特点、应用场景及核心需求

n  理解视觉模型训练的基本流程,包括数据准备、参数设置、损失函数选择等关键要素

n  理解盘古视觉大模型的实践原理,包括物体检测任务的数据预处理、模型训练过程及结果评估指标

n  理解模型推理的基本逻辑,包括输入数据处理、特征提取、结果输出的全流程

n  掌握工业级模型部署的关键技术,如模型压缩、推理引擎选择、硬件适配,确保部署后性能稳定

n  掌握部署后的验证方法,能通过实际案例验证模型推理结果的准确性和实时性

 

l  千亿参数NLP大模型训练与行业微调实践

n  了解DeepSeek大模型的发展路线、功能和效果

n  理解DeepSeek对行业及生态的影响及变革作用

n  了解DeepSeek V3R1R1-Zero的关系、R1 训练流程、R1 慢思考推理/顿悟、强化学习的创新应用、知识蒸馏、DeepSeek R1的限制与不足

n  掌握DeepSeek V3架构,包括模型结构优化、计算通信优化、训练策略优化、训练数据优化、推理优化等方向

n  了解行业大模型解决方案和实战案例

n  掌握MA Studio对接NLP三方模型的重构后流程,包括获取预置镜像与配置、上传模型权重和数据、平台配置训练等步骤,以及支持的模型及其参数

n  掌握基本资源准备、资产导入、模型训练与发布、部署的关键操作要点

 

l  知识增强型(RAG)解决方案设计与开发

n  理解RAG解决方案的概念、核心架构及应用场景

n  理解KooSearchRAG中的作用,掌握知识库构建流程,包括文档导入、解析、分片与存储

n  掌握知识检索优化技术,如向量索引构建、相似度计算、查询重写等,以提升检索准确性

n  理解结合Dify实现智能问答的原理,包括检索结果与生成模型的融合逻辑,能设计问答流程

n  了解知识库的维护机制,包括新增文档、更新旧数据、修正错误信息,以确保知识时效性

 

 

 

实验考试知识点

考核目标

掌握人工智能全流程工程化实践能力,包括数据全生命周期管理、大模型微调与部署、知识增强型系统构建。能够基于ModelArts Studio等华为云平台,完成NLP文本数据挖掘SFT问答对、NLP/CV模型工业级微调部署,基于KooSearch快速构建知识库问答,具备解决复杂场景下技术卡点的工程落地能力,以及依据业务需求设计端到端AI解决方案的能力。

 

l  数据质量工程:清洗、合成与配比

具备以下技能:

n  实现NLP文本、视觉图像、多格式文档异构数据源的标准化导入,按规范完成数据集命名与元数据配置,进行版本管控

n  执行多维度数据清洗与噪声过滤,确保数据质量达标

n  开发符合平台规范的自定义算子,实现文本智能分片及批处理调度,对文档进行合理分片并校验修正解析错误

n  基于规则与模型双驱动策略,完成高质量数据合成,结合业务场景优化数据配比

n  实施精细化人工标注与质量校验,通过多维度指标验证数据有效性

n  完成数据集的标准化发布与谱系管理,支持下游模型训练与应用开发的可追溯性

 

 

l  工业级视觉大模型训练、推理与部署

具备以下技能:

n   导入视觉数据集,发布数据集并配置相关参数

n   微调视觉大模型,设置训练参数,监控训练过程

n   部署训练后的模型,配置部署环境,获取API接口并验证接口可用性

n   调用部署的模型进行推理,验证返回结果的准确性

 

l  千亿参数NLP大模型训练、微调与应用

具备以下技能:

n   部署预置NLP大模型,配置部署资源及参数

n   在体验中心调用NLP模型进行文本对话,设计测试用例

n   验证模型输出结果的正确性,确保推理结论与预期一致

n   监控模型调用过程,处理调用中的格式问题

 

l  知识增强型(RAG)解决方案设计与开发

具备以下技能:

n   创建多语言知识库,配置解析规则及模型

n   上传多格式文档,校验文档分片质量并修正解析错误

n   构建标签化知识管理体系,实现基于标签的检索过滤

        n   创建FAQ及相似问题,调整FAQ匹配阈值,验证知识库问答的精准度与覆盖率

 

 

 

 

images_174096975717324

本文提到的考试内容仅为考生提供一个通用的考试指引,本文未提到的其他相关内容在考试中也有可能出现。


 

                                                                                                                                                                                                                                   


推荐培训                                                               

华为云人工智能专业级认证培训

 

 

附件下载

HCCDE-AI考试大纲