发布时间:2023-05-23 18:50:24
来源:股票啦
股票啦 www.gupiaola.com 2023年05月23日报道:其中的很多语言在将来几十年乃至存有消逝的风险
Meta公司周一(5月22日)推出了一个开源AI语言模型——大规模多语言语音(Massively Multilingual Speech, MMS)模型。
该模型可以识别超过4000种口语,投资美股软件是以往任何已知技术的40倍;该模型还将文本语音互转技术从100多种语言扩展到1100多种。
Meta挑选将MMS模型开源,投资美股软件以帮忙保卫语言多样性,并鼓舞钻研人员在其基础上进行进一步开发。
Meta公司在新闻稿中写道,“今天,投资美股软件人们公布分享人们的模型和代码,以便钻研界的其他人可以在人们的工作基础上再次进展。通过这项工作,人们期望为保卫全世界令人惊叹的语言多样性做出一点贡献。”
数据采集
语音识别和文本到语音模型通常需要对模型进行数千小时的音频训练,投资美股软件并附带语音转录标签。这些标签对机器学习至关重大,它使算法能够更精确地分类和明白数据。
如此一来,投资美股软件收集数千种语言的音频数据是Meta面临的第一个挑战,而现有最大的语音数据集最多涵盖100种语言。
针对那些在工业化國家没有被广泛使用的语言,投资美股软件其中的很多语言在将来几十年乃至存有消逝的风险。
Meta使用了一种比较规的方法来收集音频数据:利用翻译完成的宗教文本的录音。
该公司表达,投资美股软件“为了克服这个问题,人们转向了宗教文本,如圣经,这些文本已被翻译成多种不同的语言,这些译本也已被用于广泛的语言钻研中。”
这些宗教文本的各语言译本也有专业人士进行阅读并录音。作为MMS项目的一部分,投资美股软件Meta创建了一个超过1100种语言的“《新约》阅读数据集”,平均每种语言有32小时的数据。
此外,投资美股软件Meta还指出,考虑到其他宗教类读物的未标记录音,人们将可提供的语言数量增加到4000多种。
挽救语言多样性
这种收集数据的方法乍一听上去会让人产生一种想法:基于这些译本录音的AI模型是否会严峻偏向基督教世界观?
不过Meta指出,投资美股软件情况并非如此,“虽然录音的内容是宗教的,但人们的预测表明,这并没有使模型偏向于产生宗教语言。”
“这是因为人们使用了衔接主义时间分类(CTC)方法,投资美股软件这与大型语言模型(LLM)或语音识别的序列到序列模型相比,这种方法受到的约束要大得多。”
目前世界上很多语言都面临着消逝的危险,投资美股软件而有限的语音识别和语音生成技术只会加快这一行情趋势。
Meta在新闻稿中提出,投资美股软件期望扭转世界语言渐渐减少的行情趋势,期望每个人都能用自己的第一语言来猎取信息或使用技术。
咆哮飞鹰广西贵港大湿。。代码多少[为什么]
基民Zk78Tk黑龙江哈尔滨只要是想投机取巧违规都是错的,不要找理由,应坚决打击
michael138山东莱芜如图
赌博专用账号宁夏灵武钞票不也就是张纸
股友39J57s江苏扬中好多拖,恶心不恶心啊?忽悠小白呢?
红彤彤99999贵州凯里我只想问一下目前这种情况下美国的信用评级下调了吗
阅微股堂安徽巢湖股民的获得感就是帐户数字常红,分红送股不除权
发发发发反反复复四川眉山房价不炒,优质的房地产股你也压着?
目标正北2058黑龙江尚志涨你mei 了
xvvgjb河北武安太假。
赚钱老股民1陕西华阴5178
上一篇:怎木投资美股-Y同样运用了前后车身一体压铸技术 下一篇:个人如何投资美股:微软必应在这几个月下载量大增
今日股市行情 | 美股行情 | 明日股市预测 | 最新股市消息 | 今日股票推荐 | 今日股市新闻 | 股票入门基础知识