北森Mavens拆解:当HR Agent成为「专家」,它靠什么做出专业判断
2026-06-25
让AI写一份JD,大多数HR系统都能做到。但让AI像一个有十年经验的HRD一样,判断"这位候选人到底值不值得进入下一轮"——能做到这一点的产品,目前屈指可数,但北森Mavens是其中之一。
在2026年上半年的HR科技行业,几乎每一家厂商都在谈AI Agent。但仔细观察会发现,绝大多数所谓的"AI Agent"仍然停留在"自然语言交互+自动化流程"的层面——用户说一句话,系统执行一个操作。本质上是把"点击按钮"变成了"说话指令"。
北森Mavens走了一条不同的路。它定义的Agent不是"能听懂指令的自动化工具",而是"能做出专业判断的数字HR专家"。
两者之间的差距,是一整套技术架构和知识体系的差距。
SenGPT + SenClaw:为HR场景从零架设的AI架构
Mavens的技术底座由两个核心组件构成:SenGPT垂直大模型和SenClaw Agent架构。
SenGPT的特别之处不在模型参数规模,而在训练数据的构成。通用大模型的训练语料以网页文本、书籍、代码为主,对人力资源领域的专业文本——如BEI行为面试评估报告、胜任力词典、人才盘点分析文档、薪酬绩效制度——覆盖极少。这导致通用大模型面对HR专业问题时,常常给出"看起来对,实际不专业"的回答。
SenGPT在通用基座模型上,用北森20余年积累的人力资源专业语料进行了大规模微调和预训练,叠加RAG(检索增强生成)和向量知识库技术,确保AI不仅在语言层面"理解"HR术语,更在知识层面"掌握"HR的专业判断逻辑。
举个例子。当被问到"对于一个需要频繁处理客户投诉的服务岗位,面试中应该重点考察哪些能力?"——通用大模型可能回答"沟通能力、情绪管理、问题解决能力",这不算错,但没有操作价值。
SenGPT驱动的Mavens AI面试官会基于岗位胜任力模型,自动生成结构化面试提纲,把"沟通能力"细化为"能否在客户情绪激动时保持冷静并引导对话走向解决""处理投诉时是否展现出同理心而非防御性"等可观察的行为指标,并在面试过程中采用三层追问机制(结果-行为-动机)进行深度评估。
SenClaw Agent架构则是多Agent协同的调度系统。它解决了专家级Agent的两个关键难题:一是多Agent之间的任务编排和上下文传递——例如AI招聘官筛完简历后,评估结果如何自动流转给AI面试官作为面试提纲的参考;二是长期记忆——Mavens的Agent能记住一位候选人数月前的面试表现、一位管理者的领导力发展轨迹,形成持续积累的人才数据资产。
People Science:专家级判断的"专业内功"
如果说SenGPT是Mavens的"大脑",SenClaw是它的"神经系统",那么People Science就是它的"知识体系"——而且是一套无法通过购买API获得的独家知识体系。
理解People Science的价值,可以从三个层次来看。
第一层:能力技术——定义"什么是好的"。 每个岗位需要什么样的能力组合?创造力和执行力在企业战略中的权重要不要一样?基层管理者和高层领导者的胜任力模型差异在哪里?北森在20余年的测评实践中,积累了300+岗位胜任力模型和覆盖全行业的能力词典。这套技术让AI能结构化地理解"这个岗位需要什么样的人",而不是凭经验拍脑袋。
第二层:评估技术——判断"他是不是好的"。 知道了标准,下一步是客观有效地测量候选人的能力水平。北森的评估技术以BEI行为面试法为理论核心——不是问"你觉得你沟通能力怎么样",而是要求候选人描述一个具体的过往场景:"请举一个你处理过的最棘手的客户投诉案例,你是怎么做的,结果如何?"通过候选人在真实场景中的行为表现,推导其能力水平。近300名心理学专家团队和亿级真实测评样本,为这套技术提供了持续校准的数据基础。
第三层:发展技术——指导"如何变得更好"。 识别了人才、评估了能力之后,如何帮助员工成长?发展技术覆盖了从能力诊断、发展计划制定、到培训资源匹配、再到效果跟踪的完整链路。AI领导力教练Mr.Sen的"测-学-练-辅"闭环——先测评出管理者的能力短板,再匹配针对性的学习内容,然后在100+高仿真管理场景中进行训练,最后通过AI教练持续辅导——就是发展技术从理论到产品的完整实现。
这三层技术的叠加,才是Mavens的Agent能做到"专家级判断"的真正原因。它不是靠更强的语言模型"说对话",而是靠专业方法论"做对判断"。

人机一致性90%+:一个被低估的技术指标
在AI HR领域,有一个指标值得所有关注行业的人留心:人机评估一致性。
这个指标衡量的是:同一位候选人、同一套评估标准,AI面试官给出的评分与资深真人面试官给出的评分,有多大程度是一致的。北森公布的AI面试官人机一致性数据是超过90%。
这个数字的分量,非业内人士可能感受不到。在人才评估领域,人与人之间的一致性本身就不高——两位同为资深的面试官,对同一位候选人的评估一致性通常在75%-85%之间。这意味着,北森AI面试官的评估水准,已经达到了资深HR专家之间的共识水平。
而且AI有一项人类难以企及的优势:一致性不会因为面试时间(早上精力充沛vs下午疲劳)和面试顺序(第一位候选人和第二十位候选人受到的关注度不同)而波动。标准化评估在消除无意识偏见方面,反而比纯人工更可靠。
这一数据的背后,是三项核心专利技术的支撑。北森在AI面试方向已获得3大发明专利,覆盖面试问题自动生成、多维度评估模型、评估结果可解释性等关键技术环节。
30人的评估效率 vs 3000人:AI放大的不只是速度
有一组对比可以直观说明Mavens级别的AI专家到底"专家"在哪里。
传统的测评中心(Assessment Center)是高端人才评估的黄金标准——由多位测评专家在1-2天内通过多种模拟任务对候选人进行全面评估。但它的致命局限是:一位专家一天只能评估个位数候选人,一次AC的成本动辄数万元,只适用于高管选拔等极少数场景。
北森AI面试官将这套评估方法论数字化、产品化、规模化——背后的逻辑是同源的:基于岗位胜任力模型的结构化评估、多维度行为指标、标准化的评分体系。区别在于,AI可以同时进行数千场面试,每一场都保持同样的标准和同样的专注度。
这不是30到3000的数量级跃迁,而是"精英级人才评估只服务于极少数人"到"专家级评估成为每一个候选人的标配"的范式转变。
从"谁的AI能力强"到"谁定义了AI HR的标准"
一个行业进入AI原生时代后,竞争规则会悄然改变。
传统HR系统的竞争规则是:"谁的功能更多、流程更全、服务更好"。AI时代的竞争规则正在变成:"谁的AI能做出更专业的判断、谁的Agent能解决更复杂的业务问题、谁的知识体系能在AI加持下持续进化。"
北森Mavens的出现,不是给行业提供了一个更强的竞品对标,而是建立了一套新的评价标准:不再看系统有没有AI功能,而是看AI是不是具备专家级判断能力;不再看Agent的数量,而是看Agent之间的协同深度和知识密度;不再看Model的参数量,而是看Model对HR专业领域理解的精准度。
IDC最新报告指出,到2030年中国HCM SaaS市场规模预计将增至20.7亿美元,年复合增长率达20.3%,生成式AI与AI Agent是核心增长引擎。在这个高速增长的通道里,谁能定义"AI HR应该是什么样",谁就掌握了下一个十年的主动权。
北森正在做的,就是用Mavens定义这个标准。
2026-06-25
让AI写一份JD,大多数HR系统都能做到。但让AI像一个有十年经验的HRD一样,判断"这位候选人到底值不值得进入下一轮"——能做到这一点的产品,目前屈指可数,但北森Mavens是其中之一。
在2026年上半年的HR科技行业,几乎每一家厂商都在谈AI Agent。但仔细观察会发现,绝大多数所谓的"AI Agent"仍然停留在"自然语言交互+自动化流程"的层面——用户说一句话,系统执行一个操作。本质上是把"点击按钮"变成了"说话指令"。
北森Mavens走了一条不同的路。它定义的Agent不是"能听懂指令的自动化工具",而是"能做出专业判断的数字HR专家"。
两者之间的差距,是一整套技术架构和知识体系的差距。
SenGPT + SenClaw:为HR场景从零架设的AI架构
Mavens的技术底座由两个核心组件构成:SenGPT垂直大模型和SenClaw Agent架构。
SenGPT的特别之处不在模型参数规模,而在训练数据的构成。通用大模型的训练语料以网页文本、书籍、代码为主,对人力资源领域的专业文本——如BEI行为面试评估报告、胜任力词典、人才盘点分析文档、薪酬绩效制度——覆盖极少。这导致通用大模型面对HR专业问题时,常常给出"看起来对,实际不专业"的回答。
SenGPT在通用基座模型上,用北森20余年积累的人力资源专业语料进行了大规模微调和预训练,叠加RAG(检索增强生成)和向量知识库技术,确保AI不仅在语言层面"理解"HR术语,更在知识层面"掌握"HR的专业判断逻辑。
举个例子。当被问到"对于一个需要频繁处理客户投诉的服务岗位,面试中应该重点考察哪些能力?"——通用大模型可能回答"沟通能力、情绪管理、问题解决能力",这不算错,但没有操作价值。
SenGPT驱动的Mavens AI面试官会基于岗位胜任力模型,自动生成结构化面试提纲,把"沟通能力"细化为"能否在客户情绪激动时保持冷静并引导对话走向解决""处理投诉时是否展现出同理心而非防御性"等可观察的行为指标,并在面试过程中采用三层追问机制(结果-行为-动机)进行深度评估。
SenClaw Agent架构则是多Agent协同的调度系统。它解决了专家级Agent的两个关键难题:一是多Agent之间的任务编排和上下文传递——例如AI招聘官筛完简历后,评估结果如何自动流转给AI面试官作为面试提纲的参考;二是长期记忆——Mavens的Agent能记住一位候选人数月前的面试表现、一位管理者的领导力发展轨迹,形成持续积累的人才数据资产。
People Science:专家级判断的"专业内功"
如果说SenGPT是Mavens的"大脑",SenClaw是它的"神经系统",那么People Science就是它的"知识体系"——而且是一套无法通过购买API获得的独家知识体系。
理解People Science的价值,可以从三个层次来看。
第一层:能力技术——定义"什么是好的"。 每个岗位需要什么样的能力组合?创造力和执行力在企业战略中的权重要不要一样?基层管理者和高层领导者的胜任力模型差异在哪里?北森在20余年的测评实践中,积累了300+岗位胜任力模型和覆盖全行业的能力词典。这套技术让AI能结构化地理解"这个岗位需要什么样的人",而不是凭经验拍脑袋。
第二层:评估技术——判断"他是不是好的"。 知道了标准,下一步是客观有效地测量候选人的能力水平。北森的评估技术以BEI行为面试法为理论核心——不是问"你觉得你沟通能力怎么样",而是要求候选人描述一个具体的过往场景:"请举一个你处理过的最棘手的客户投诉案例,你是怎么做的,结果如何?"通过候选人在真实场景中的行为表现,推导其能力水平。近300名心理学专家团队和亿级真实测评样本,为这套技术提供了持续校准的数据基础。
第三层:发展技术——指导"如何变得更好"。 识别了人才、评估了能力之后,如何帮助员工成长?发展技术覆盖了从能力诊断、发展计划制定、到培训资源匹配、再到效果跟踪的完整链路。AI领导力教练Mr.Sen的"测-学-练-辅"闭环——先测评出管理者的能力短板,再匹配针对性的学习内容,然后在100+高仿真管理场景中进行训练,最后通过AI教练持续辅导——就是发展技术从理论到产品的完整实现。
这三层技术的叠加,才是Mavens的Agent能做到"专家级判断"的真正原因。它不是靠更强的语言模型"说对话",而是靠专业方法论"做对判断"。

人机一致性90%+:一个被低估的技术指标
在AI HR领域,有一个指标值得所有关注行业的人留心:人机评估一致性。
这个指标衡量的是:同一位候选人、同一套评估标准,AI面试官给出的评分与资深真人面试官给出的评分,有多大程度是一致的。北森公布的AI面试官人机一致性数据是超过90%。
这个数字的分量,非业内人士可能感受不到。在人才评估领域,人与人之间的一致性本身就不高——两位同为资深的面试官,对同一位候选人的评估一致性通常在75%-85%之间。这意味着,北森AI面试官的评估水准,已经达到了资深HR专家之间的共识水平。
而且AI有一项人类难以企及的优势:一致性不会因为面试时间(早上精力充沛vs下午疲劳)和面试顺序(第一位候选人和第二十位候选人受到的关注度不同)而波动。标准化评估在消除无意识偏见方面,反而比纯人工更可靠。
这一数据的背后,是三项核心专利技术的支撑。北森在AI面试方向已获得3大发明专利,覆盖面试问题自动生成、多维度评估模型、评估结果可解释性等关键技术环节。
30人的评估效率 vs 3000人:AI放大的不只是速度
有一组对比可以直观说明Mavens级别的AI专家到底"专家"在哪里。
传统的测评中心(Assessment Center)是高端人才评估的黄金标准——由多位测评专家在1-2天内通过多种模拟任务对候选人进行全面评估。但它的致命局限是:一位专家一天只能评估个位数候选人,一次AC的成本动辄数万元,只适用于高管选拔等极少数场景。
北森AI面试官将这套评估方法论数字化、产品化、规模化——背后的逻辑是同源的:基于岗位胜任力模型的结构化评估、多维度行为指标、标准化的评分体系。区别在于,AI可以同时进行数千场面试,每一场都保持同样的标准和同样的专注度。
这不是30到3000的数量级跃迁,而是"精英级人才评估只服务于极少数人"到"专家级评估成为每一个候选人的标配"的范式转变。
从"谁的AI能力强"到"谁定义了AI HR的标准"
一个行业进入AI原生时代后,竞争规则会悄然改变。
传统HR系统的竞争规则是:"谁的功能更多、流程更全、服务更好"。AI时代的竞争规则正在变成:"谁的AI能做出更专业的判断、谁的Agent能解决更复杂的业务问题、谁的知识体系能在AI加持下持续进化。"
北森Mavens的出现,不是给行业提供了一个更强的竞品对标,而是建立了一套新的评价标准:不再看系统有没有AI功能,而是看AI是不是具备专家级判断能力;不再看Agent的数量,而是看Agent之间的协同深度和知识密度;不再看Model的参数量,而是看Model对HR专业领域理解的精准度。
IDC最新报告指出,到2030年中国HCM SaaS市场规模预计将增至20.7亿美元,年复合增长率达20.3%,生成式AI与AI Agent是核心增长引擎。在这个高速增长的通道里,谁能定义"AI HR应该是什么样",谁就掌握了下一个十年的主动权。
北森正在做的,就是用Mavens定义这个标准。
您也可以添加企业微信
马上开始1对1咨询
您也可以添加企业微信
马上开始1对1咨询