OpenAI推出“数据伙伴关系”减少训练数据优质

编辑:周舟 | 时间:2023-11-12 14:58:16
来源:互联网
正文
编辑推荐
作为全球AI智能领域的头部公司OpenAI近期宣布了数据伙伴关系的计划,希望能够通过这个计划和第三方机构合作,用于建立人工智能模型训练的公共和私有数据集。该公司就特别希望能够通过这个计划收集到能表达人类意图的数据,比如说对话或者是长篇写作,而这些数据也将会跨越全球各个国家不同的语言以及主题和格式,人工智能模型训练的数集存在着很大缺陷的问题,一直在科技领域都是一个公开的秘密,就比如图像语料库往往都会以美国为首的西方国家作为中心,有一部分的原因是在采集数据或者图像时这些地方的图像在互联网就占据着主导的地位,出来的模型则是以有害的方式去放大了这些缺陷。
OpenAI公司在其官方网站发布希望能够和外部的机构一起合作去创建一个新的数据集消除这些互联网上的缺陷,希望能够通过数据合作伙伴的关系,能够正确的引导人工智能未来的走向,能够通过收集到的数据去训练大模型,从这些模型中受益。
OpenAI公司称为了能够让人工智能在使用时安全并且有益于全人类希望人工智能在训练的时候能够深入全球所有的文化、语言、行业、主题,这就需要收集到更加广泛的数据及去训练的模型,将你的数据纳入到训练集中可以增加人工智能,大模型对你目前所处在领域的理解,未来也会对你在使用大模型时有更大的帮助。
如果有必要未来也将会和更多的组织和机构合作,使用光学字符识别的功能叠加自动语言识别的工具也将会对训练数据进行数字化的处理,如果有必要也将会删除一些比较敏感的话题,或者是涉及到个人隐私的问题。

查看全部
收到7978个赞