admin 最新资讯 2021-03-08

容联AI实现「数据自动化打标」和「测试集自动提取」

尊敬的用户：

本周迎来容联AI Call产品又一次更新，本次更新重点丰富自学习平台的功能，旨在让运营更智能，提高运营整体工作效率，实现【数据自动打标】，自动将原始数据进行数据清洗、数据标注、数据分类，有效缩短了数据标注工期。同时，打破传统测试集数据手动拆分方式，实现【测试集数据自动提取】，数据提取更科学，评测结果更真实。

如下为V5.1.1本次更新内容：

升级说明

1、打通线上「数据集」一体化流程

数据集上传、模型训练、模型评测、模型发布和解绑，都可以在自学习平台完成，打通线上数据集管理、模型训练、模型评测、模型发布一体化流程。

2、数据自动打标功能

针对海量数据，通过人工对数据进行标注，无法保证高效的完成数据清洗标注以及数据分类。本次自学习平台新增数据自动打标动能，仅需上传原始数据集文件，系统按照配置策略，自动将原始数据进行数据清洗、数据标注、数据分类，人工仅需完成简单的复检，即可将数据用于模型训练，有效缩短了数据标注工期。

3、模型训练更灵活

本次在模型训练任务上增加了任务排队机制，支持取消训练，在面对大量模型训练任务时，可以更好的承载超大并发量的模型训练任务，从而提升模型训练的效率。

4、测试集数据自动提取

过去的测试集数据是在训练集数据中通过手动的方式进行拆分，耗时耗力，如果数据拆分不均匀，还可能导致最终模型效果不佳、评测结果存在偏差。本次迭代打破传统方式，仅需在模型训练时，选择所需训练集文件，系统自动按照训练集标签数量提取一定比率的测试集数据出来，数据提取更科学，评测结果更真实。

5、支持意图、多意图、情感、句式识别模型评测

在模型评测方面，本次新增单意图、多意图、情感、句式识别的模型评测结果输出，同时我们还对模型评测的指标计算方式进行调优处理，使模型结果数据评测更加精准有效。

6、内置通用模型数据，全平台可使用

结合容联在数据上的沉淀积累，容联将百万级数据通过清洗整理，并训练成行业场景的通用模型，尽可能实现开箱即用，减低冷启环节的耗时。本次更新容联将这些模型开放出来，可供全平台的租户使用。

7、数据安全升级

本次数据安全升级主要从两个方面进行了全新升级，一方面对数据本身的安全加密，采用符合绝大部分客户要求的密码算法对数据进行主动保护，另一方面对数据防护的安全，采用信息存储手段对数据进行主动防护。所有训练平台数据统一放入NAS目录进行存储。

免责申明：
1. 本站所有下载资源均不包含技术支持和安装服务！需要讨论请进群！
2. 分享目的仅供大家学习和交流，请不要用于商业用途！
3. 如果你也有好源码或者教程，可以到审核区发布，分享有KR奖励和额外收入!
4. 如有链接无法下载、失效或广告，请联系管理员处理！
5. 本站无法保证资源或破解时效性，如某些授权码过期等问题，恕不在修复范围内。
6. 本站资源售价只是赞助，收取费用仅维持本站的日常运营所需！故不接受任何形式的退款，如确认资源确有问题的，会补给相应KR以供再次购买。
7. 53Kr源码暂未发现后门代码，但无法保证100%安全，推荐检测方法：上传到 https://www.virustotal.com/在线查看是否有恶意代码以及其他有后门嫌疑的代码。
8. 在本站下载的源码我还是不建议正式使用，有特别喜欢的可以去程序官方购买。
53kr资源站仅提供学习的平台，所有资料均来自于网络，版权归原创者所有！本站不提供任何保证，并不承担任何法律责任，如果对您的版权或者利益造成损害，请提供相应的资质证明，我们将于3个工作日内予以删除。
53kr资源分享 » 容联AI实现「数据自动化打标」和「测试集自动提取」

分享到：

发表回复 取消回复

发表回复取消回复