您当前位置:首页 > 财经

开源大模型新SOTA,支持免费商用,比LLaMA65B小但更强,基于1万

来源:IT之家   阅读量:8087   
时间: 2023-05-31 14:42

号称“史上最强的开源大语言模型”出现了。

它叫 Falcon,参数 400 亿,在 1 万亿高质量 token 上进行了训练。

最终性能超越 650 亿的 LLaMA,以及 MPT、Redpajama 等现有所有开源模型。

一举登顶 HuggingFace OpenLLM 全球榜单:

除了以上成绩,Falcon 还可以只用到 GPT-3 75% 的训练预算,性能就显著超越 GPT-3,且推理阶段的计算也只需 GPT-3 的 1/5。

据悉,这只半路杀出来的“猎鹰”来自阿联酋阿布扎比技术创新研究所 。

有意思的是,作为一个开源模型,TII 在 Falcon 上推出了一个相当特别的授权许可证要求:

可以商业使用,但如果用它产生的收益超过了 100 万美元,就要被收取 10% 的授权费。

一时之间,争议满满。

史上最强开源 LLM

据介绍,Falcon 属于自回归解码器模型。

它使用自定义工具构建,包含一个独特的数据管道,该管道从公开网络中提取训练数据。

——Falcon 宣称它“特别注重数据质量”,从公网上抓取内容构建好 Falcon 的初始预训练数据集后,再使用 CommonCrawl 转储,进行大量过滤并消除重复数据,最终得到一个由近 5 万亿个 token 组成的庞大预训练数据集。

为了扩大 Falcon 的能力,该数据集随后又加进了很多精选语料,包括研究论文和社交媒体对话等内容。

除了数据把关,作者还对 Falcon 的架构进行了优化以提升性能,但细节没有透露,相关论文将很快发布。

据悉,Falcon 一共耗费两个月,在 AWS 的 384 个 GPU 上训练而成。

最终,Falcon 一共包含 4 个版本:

  • Falcon-40B:在 1 万亿 token 上进行训练,并使用精选语料库进行了增强;主要接受英语、德语、西班牙语、法语的训练,不会中文。

  • Falcon-40B-Instruct:在 Baize 上进行了微调,使用 FlashAttention 和多查询对推理架构进行了优化,是一个即用型聊天模型。

  • Falcon-7B:参数 70 亿,在 1.5 万亿 token 上进行了训练,作为一个原始的预训练模型,还需要用户针对大多数用例进一步微调。

  • Falcon-RW-7B:参数 70 亿,在 3500 亿 token 上进行训练,该模型旨在用作“研究神器”,单独研究各种在网络数据进行训练的影响。

开源许可证引争议

Falcon 作为开源模型,已公开源代码和模型权重,可供研究和商业使用。

这对业界来说是一个好消息,毕竟像 Meta 的羊驼家族都只能用于研究目的,且还得填表格申请才行,很是麻烦。

但 Falcon 还是引起了争议。

这主要是因为它那“超过 100 万美元的任何商业应用都要收 10% 的授权费”的许可证要求。

据悉,该许可证部分基于 Apache License 2.0 协议,该协议对商业应用友好,使用者修改代码只需满足相关需求即可将新作品作为开源或商业产品发布或销售。

有不少网友认为,既然 Falcon 宣称开源,还要收费,就违背了 Apache License Version 2.0 的宗旨,不属于真正的开源。

并有人称这是一种“有损 Apache 软件基金会来之不易的名誉”的做法。

有网友已经跑到 TII 的官方账号下“讨要说法”:

你自己能解释一下这是如何符合“开源”的定义吗?

目前,官方并没有回复。

你认为这种做法究竟算不算开源呢?

参考链接:

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

金融聚焦

 感谢IT之家网友独立摄影师的线索投递! ,唯卓仕推出新品16mmF1.8FE全画幅超广角镜头,重量约为550g,售价3499元。 新款镜头采用12组15片结

2023-05-31 14:42

 感谢IT之家网友西窗旧事的线索投递! ,据路透社报道,丰田汽车公司周三表示,由于云端设置错误,亚洲和大洋洲一些国家的客户信息可能在2016年10月至2023年

2023-05-31 14:42

 感谢IT之家网友华南吴彦祖的线索投递! ,曜越在2023台北国际电脑展上推出了新款ToughpowerSFX系列电源。 此次曜越带来了全新的750W、850

2023-05-31 14:42

 感谢IT之家网友雨雪载途、grass罗雨滋、注册好多次怎么都失败的线索投递! ,今天13时12分,印度空间研究组织在萨迪什?达万航天中心使用GSLVMKII运

2023-05-31 14:42

 感谢IT之家网友雨雪载途的线索投递! ,比亚迪与西班牙巴士制造商Castrosua推出首款定制化12米纯电巴士,5月29日在西班牙下线并首次亮相,新车发布会在

2023-05-31 14:42

 三星移动固态硬盘T7发布于2020年5月20日,1050MB/s+Type-c接口,1TB版发售价为1499元。 京东618大促期间,5月31日晚20点~6月

2023-05-31 14:42

 北京时间5月30日,英伟达盘前涨至404美元,市值突破1万亿美元。这一波连续上涨被认为是生成式人工智能爆火的功劳,因为英伟达占据了能处理复杂计算的GPU。 2

2023-05-31 14:42

 这几天,在位于安徽省安庆市宜秀经开区的安徽乐京新能源科技有限公司,一台台崭新的空调正组装下线。这个总投资22亿元的智能家电产业基地,在宜秀区政府的大力支持下,从

2023-05-31 14:42

 据官方介绍,全新CAMM内存采用了全新的架构设计,相比现在的内存薄了57%,另外其功耗更低,拥有更高的存储效率。 威刚表示,这种内存专为笔记本电脑和小型工业计

2023-05-31 14:42

 感谢IT之家网友浪歌的线索投递! ,上周三,英伟达发布了第一季度财报,单季度净利润20.43亿美元远超预期,同比增长26%,环比增长44%,在当前大环境下堪称

2023-05-31 14:42

 感谢IT之家网友雨雪载途的线索投递! ,科乐美公司日前宣布重制《合金装备3:食蛇者》,将于今年秋季推出《合金装备Δ:食蛇者》。那么小岛秀夫是否会参与这款游戏?

2023-05-31 14:42

 ,5月30日,汽车博主嘉梁车生活号称拍摄到了小米首款汽车MS11的高清视频。 从视频中可以看出,新车依旧包裹大面积的伪装,据嘉梁车生活称,他之所以确定这是小米

2023-05-31 14:42

 :5月31日,据上海证券交易所披露,南京安居建设集团有限责任公司2023年面向专业投资者公开发行公司债券状态更新为已受理。 观点新媒体获悉,本期债券品种为小公

2023-05-31 14:42

 据此前官方宣布,全新的vivoS17系列将于5月31日也就是今天14:30正式与大家见面,将继续主打柔光人像。随着发布会进入最后的倒计时,截至目前官方和外界已经

2023-05-31 14:42

 近期,由证券时报社主办、国信证券承办的第十四届“天马奖”高峰论坛暨国信证券中期投资策略会隆重举行。论坛上揭晓了本届“天马奖”获奖名单,贝泰妮凭借在投资者关系互动

2023-05-31 14:42

 “我每天都会顺手打开我在银行开设的碳账户,打卡减碳活动,比如绿色出行、随手关灯关空调、使用环保袋等,在节能减排的同时还能获取积分用以兑换奖品,一举多得。”上海一

2023-05-31 14:42

 供需博弈之下,国际油价在震荡中走低。4月初欧佩克+意外减产,短暂地扭转了油价的下跌态势。但好景不长,在经济担忧等多重利空因素笼罩下,油价再度走弱。为此,欧佩克内

2023-05-31 14:42

 感谢IT之家网友华南吴彦祖的线索投递! ,模块化笔记本厂商Framework将在今年晚些时候推出16英寸的Laptop16大屏型号,显卡、存储、屏幕、键盘等部

2023-05-31 14:42

 感谢IT之家网友雨雪载途的线索投递! ,据IT之家网友反馈,华为MatePadAir平板电脑开始推送上市后的首个更新鸿蒙HarmonyOS3.1.0.112,

2023-05-31 14:42

 ,安克Anker发布了一款新的USB-C扩展坞,可与最新的苹果MacBook兼容。 Anker547USB-C扩展坞移动了HDMI端口位置,以免阻挡MagSa

2023-05-31 14:42

市场金融网
关注我们
foota footb footc footd foote footf