1. 首页
  2. 快讯

10个样本扩展到242种语言,Adaption Labs要从数据层解决AI多语言短板

据 动察 Beating 监测,AI 数据平台 Adaption Labs 发布 Adaptive Data 新功能「Expand Your World」,从单一语言的最少 10 个样本出发,可生成覆盖 242 种语言和地区变体的最多 2,420 个高质量训练样本,无需额外标注流程或数据管道。该功能已对所有 Adaptive Data 用户开放。多语言覆盖是 AI 训练数据的主要短板之一。大多数数据集集中在少数高资源语言上,模型对小语种和地区方言的处理能力显著偏弱,后期微调难以完全弥补。Adaption Labs 的思路是把语言覆盖前置到数据层,在训练数据生成阶段就解决分布偏差。Adaption Labs 由前 Cohere 研究副总裁 Sara Hooker 和前谷歌 AI 基础设施工程师 Sudip Roy 联合创办,今年 2 月获 Emergence Capital 领投的 5000 万美元种子轮融资,估值 10 亿美元。公司的核心押注是用高效的自适应系统替代暴力扩展,让模型能持续学习和演化。





免责声明:本站所有内容不构成投资建议,币市有风险、投资请慎重。
- 比特头条

相关推荐