最强大开源语言模型?FalconLM号称性能击败Meta的LLaMA

编程客栈()5月30日 消息:当下,开源语言模型如雨后春笋般的冒出,其中有部分号称性能比Meta、谷歌等大科技公司开发的产品更优秀。


(资料图)

最近,一款名为FalconLM 开源语言模型就号称提供了比 Meta 的 LLaMA 更好的性能,也可以用于商业。但如果收入超过100万美元,则商业用途需要缴纳特许权使用费。

据了解,Falc编程onLM 是由阿拉伯联合酋长国阿布扎比的技术创新研究所 (TII) 开发。该组织声称 FalconLM 是迄今为止最强大的开源语言模型。相比之下,FalconLM 最大的变体拥有400亿个参数,这明显小于Meta 的具有650亿个参数的 LLaMA编程客栈。

在总结各种基准测试结果的Hugging Face OpenLLM 排行榜上,两个最大的 FalconLM 模型(其中一个已经用指令进行了改进)目前以显着优势占据前两名。

FalconLM 比 GPT-3训练成本更低效果更好

根据开发团队的说法,FalconLM 竞争优势的一个重要方面是训练数据的选择。语言模型在训练期间对数据质量很敏感。

研究团队开编程客栈发了一种从公共爬网数据集中提取高质量数据并删除重复数据的流程。在彻底清除重复数据GHYZh后,仍保留了5万亿条文本(token)——足以训练强大的语言模型。

FalconLM 接受了万亿token的训练。TII 还提到了针对性能和效率优化的架构,但没有提供详细信息。

据该团队称,优化的架构与高质量的数据集相结合,使得 FalconLM 在训练期间仅需要GPT-3的75% 的计算量,但明显优于旧的 OpenAI 模型。据说推理成本是 GPT-3的五分之一。

TII 的 FalconLM 用例包括文本生成、解决复杂问题、将模型用作个人聊天机器人,或用于客户服务或翻译等商业领域。

在商业应用中,TII 希望商业使用场景下,使用该语言模型获得100万美元收入后,将收取收入GHYZh的10% 作为版税,而对于个人使用和研究,FalconLM 是免费的。

FalconLM 模型的所有版本均可从 Huggingface 免费下载,网址:https://huggingface.co/tiiuae。

除了这些模型,该团队还在Apache2.0许可下以开源形式发布了包含6000亿个文本token的“Refinedweb”数据集的一部分。据说该数据集已准备好进行多模式扩展,因为示例已经包含图像的链接和替代文本。网址:https://huggingface.co/datasets/tiiuae/falcon-refinedweb

关键词:

为您推荐

最强大开源语言模型?FalconLM号称性能击败Meta的LLaMA

编程客栈()5月30日消息:当下,开源语言模型如雨后春笋般的冒出,其中有部分号称性能比Meta、谷歌等大科技

来源:站长之家2023-05-30

会计软件排行榜 会计软件哪种好 环球消息

今天来聊聊关于会计软件排行榜,会计软件哪种好的文章,现在就为大家来简单介绍下会计软件排行榜,会计软件

来源:城市网2023-05-30

用镜头记录莒国故里风情

5月24日至26日,第六届中国(日照)新闻摄影周暨主流媒体聚焦“日照绿色低碳高质量发展”新闻摄影采访在山

来源:三亚新闻网2023-05-30

环球热文:麒麟信安:5月29日融资买入411.78万元,融资融券余额9971.4万元

5月29日,麒麟信安(688152)融资买入411 78万元,融资偿还296 77万元,融资净买入115 0万元,融资余额9331 51万元。

来源:证券之星2023-05-30

世界即时看!干部下基层多办服务群众的“暖心事”

“太好了,今年大伙儿种植富硒大米的积极性不用愁了!”山东省东营市东营区文汇街道兰赵村党支部书记周海彬

来源:人民网2023-05-30

环球时讯:二级建造师市政专业报考条件,二级建造师市政报考条件

你好,2020年云南二级建造师报考条件具体如下一凡遵纪守法并具备工程类或工程经济类中等专科以上学历并从事

来源:注册建造师网2023-05-30

享受春日美景,光华实小亲子游作品评选有看头|环球速递

春天总是美好但又短暂,眨眼间已然立夏。成都市温江区光华实验小学校春日亲子游作品评选活动也传来尾声,一

来源:成都市温江区光华实验小学校2023-05-30

淋巴细胞转换试验(LTT)(关于淋巴细胞转换试验(LTT)介绍) 世界观热点

来为大家讲解以上的问题。淋巴细胞转换试验(LTT),巴细胞转换试验(LTT)介绍这个很多人还不知道,我们一起来

来源:互联网2023-05-30