价值成果
瀚才咨询负责人谭笑然从百度大脑开放平台了解到EasyDL定制化训练和服务平台,可助其利用文本分类将人才信息的行业和职级的分类模型进行训练,并能将积累十余年的万条经营数据进行企业内部信息结构化分类。在一个月内,他和同事们利用EasyDL专业版文本分类模型,其中“候选人职能”、“候选人职级”这2个模型的识别准确率达到了99%+,成功将积累十余年利用率不到10%的万条经营数据进行企业内部的信息结构化分类,划分成12个大行业、个小行业和10个通用职级信息,让被“遗弃”的数据实现了可供匹配的“用武之地”。
案例故事
核心诉求
瀚才咨询长期留存着万条不同行业的企业和人才信息,这是由于近年来行业、公司、职能、职级等存在着巨大差异而致使企业与人才信息的梳理变得十分繁杂,并且无法很好地进行结构化整理所导致的。瀚才咨询的负责人谭笑然也曾想过使用人工分类的方式进行整理,但由于人工逐条分类标注费用极高且培养一位能够掌握分类标准的业务人员耗时过长,进而导致长期留存的数据库反而成为交付服务时的“阻力”。因此,瀚才咨询迫切需要找寻一款对文本分类有着高准确率的人工智能产品,来助其解决这项难题。
解决方案
瀚才咨询通过EasyDL专业版成功地将企业内部经营信息及候选人信息,安全、高效、低成本地进行了结构化分类,并完成了定制模型与日常管理的后台集成,成功将日常运营数据进行了内容上的结构化处理。
瀚才咨询的EasyDL”数据拯救”方案如下:
第1步:从数据清洗开始,综合运用百度大脑iOCR自定义模板文字识别、通用文字识别、通用表格识别、词法分析这4项AI能力将原始信息进行数据清洗;
应用百度大脑AI能力“清洗”瀚才猎头万条数据的流程图:
第2步:瀚才咨询安排了两位经验丰富的骨干员工利用工作之余标注了1万条数据作为训练数据进行模型训练;
第3步:在EasyDL平台上通过智能标注功能实现剩下万条数据自动标注,再通过EasyDL专业版的文本分类ERNIE预训练模型和BilSTM预置网络进行快速训练;
第4步:经过5次版本迭代,“候选人职能”、“候选人职级”这2个模型的识别准确率达到了99%+。
EasyDL专业版文本分类操作界面:
百度大脑EasyDL专业版功能介绍:
本案例中使用产品:EasyDL定制化文本分类
如需合作,请您进入AI开发者社区,进行沟通交流。
转载请注明:http://www.0431gb208.com/sjslczl/4251.html