您现在的位置是:探索 >>正文
Meta称其LLaMA 语言模型比OpenAI 的 GPT-3更有前景
探索16人已围观
简介在OpenAI推出大型语言模型ChatGPT后,竞争对手纷纷迎头赶上。有 Bard,有新必应。现在,Meta也上线了一个新模型LLaMA。目前,该模型只对研究人员开放。据了解,LLaMA是 Large ...
在OpenAI推出大型语言模型ChatGPT后,语言模竞争对手纷纷迎头赶上。型比有 Bard,前景有新必应。语言模现在,型比Meta也上线了一个新模型LLaMA。前景目前,语言模该模型只对研究人员开放。型比
据了解,前景LLaMA是语言模 Large Language Model Meta AI 的首字母缩写词,比现有的型比模型更小,因为它是前景为无法访问大量基础设施的研究社区构建的。LLaMA 有多种尺寸,语言模从70亿个参数到650亿个参数不等。型比
Meta方面称,前景尽管 LLaMA-13B 的尺寸较小,而且少了1620亿个参数,但“在大多数基准测试中”表现优于 OpenAI 的GPT-3。
据报道,最大的模型 LLaMA-65B 与 DeepMind 的Chinchilla70B和PaLM-540B等模型可相提并论。
LLaMA 是一个基础模型:它在大量未标记数据上进行训练,这使得研究人员更容易针对特定任务微调模型。由于模型更小,因此更容易针对用例进行再训练。
LLaMA不仅仅是使用英语文本构建的。Meta使用20种使用拉丁语或西里尔语脚本的语言训练其模型。然而,大多数训练数据都是英语,因此模型性能更好。
Meta 的研究人员声称,由于模型的大小,对当前大型语言模型的访问受到限制。
Meta 认为“这种受限访问限制了研究人员理解这些大型语言模型如何工作以及为何工作的能力,阻碍了提高其稳健性和解决已知问题(例如偏见、侮辱和产生错误信息的可能性)的努力”。
除了使模型更小之外,Meta 还试图让 LLaMA 更易于访问,包括在非商业许可下发布它。
对各种 LLaMA 模型的访问权限只会根据具体情况授予学术研究人员,例如隶属于政府、民间组织和学术界的研究人员。
与 ChatGPT 一样,LLaMA 与其他语言模型一样存在生成有偏见或不准确的信息。Meta 的 LLaMA 声明承认了这一点,并表示通过共享模型,研究人员可以“更轻松地测试新方法来限制或消除大型语言模型中的这些问题。”
Meta在去年5月曾推出一款面向研究人员的名为OPT-175B的大型语言模型,去年年底还发布过另一款模型Galactica,但后者被发现经常分享有偏见或不准确的信息,在48小时内被迅速下架。
Tags:
相关文章
高瓴陪跑良品铺子拟“功成身退”,休闲食品赛道还在等春天
探索来源:华夏时报本报chinatimes.net.cn)记者姜艳鑫 黄兴利 北京报道过去一年多,高瓴对的减持可谓轻风细雨,但彻底离开的时间表已经近了。11月21日,良品铺子公告称,珠海高瓴天达投资中心有 ...
【探索】
阅读更多2022年中国网络文明大会算法治理论坛在天津举行
探索来源:网信中国8月29日,2022年中国网络文明大会算法治理论坛在天津举行。本次论坛以“加强算法综合治理 助力网络文明建设”为主题,旨在推动规范算法应用,加快推进算法治理赋能国家治理创新,助力网络文明 ...
【探索】
阅读更多银河证券:低估值医药企业中基本面稳健的或有更高相对收益
探索新浪财经公众号 24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注sinafinance) ...
【探索】
阅读更多