微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5|天天简讯
(资料图片仅供参考)
IT之家 6 月 27 日消息,AI 模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款 13 亿参数的语言模型 phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的 GPT 3.5”。
IT之家注意到,该模型以 Transformer 架构为基础,微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”,以及 8 个英伟达 A100 GPU,在短短 4 天内完成训练。
微软团队表示,比起增加模型的参数量,通过提高模型的训练数据集质量,也许更能强化模型的准确率和效率,于是,他们利用高质量数据训练出了 phi-1 模型。在测试中,phi-1 的分数达到 50.6%,比起 1750 亿参数的 GPT-3.5(47%)还要好。
微软表示,phi-1 接下来会在 HuggingFace 中开源,而这不是微软第一次开发小型 LLM,此前,他们打造一款 130 亿参数的 Orca,使用了 GPT-4 合成的数据训练而成,表现也同样比 ChatGPT 更好。
目前关于 phi-1 的论文已经在 arXiv 中发布,可以在这里找到论文的相关内容。
关键词:
责任编辑:宋璟
-
微软打造 13 亿参数小型 LLM AI模型,效果胜于千亿参数 GPT-3.5|天天简讯
-
【环球快播报】欧弟蒙面歌王情愿 欧弟蒙面歌王
-
50年来 江西累计派出45批援外医疗队共1468名医疗队员
-
今日聚焦!涉嫌受贿、违法发放贷款!云南检察机关依法对戴世宏提起公诉
-
能链智电发布2022年度ESG报告:全年碳减排184.77万吨 同比提升106.22% 要闻速递
-
天天热点!中原证券CIO刘灏曾跳槽过多家公司 薪酬391.34万在公司高管中是最高的
-
全球观察:与金溥聪讨论九二共识?侯友宜:已充分沟通
-
“港车北上”政策7月1日零时起施行 香港司机看过来
-
全球新动态:年轻人想要富有和幸福,就要学会这个方法:租房不如买房!
-
深圳激光治疗近视手术医院哪家好 眼睛恢复不是梦 环球讯息
-
全球快消息!基金经理万民远自购旗下新发基金100万元
-
天天短讯!传宗接代视频_传宗接代
-
方位介词in/on/under_关于方位介词in/on/under简介|天天热消息
-
环球视点!2023年苏州市区跨区招生录取最低控制分数线公布
-
白酒股走势中隐藏的密码3.17
-
宠物市场布局情况及未来发展战略如何?美农生物这样答复_世界热推荐
-
当前看点!上一步干_上一步
-
学习AI08如何搭配夏季女士泳衣 环球快讯
-
宝马X1 M35i发布:312匹暴躁小怪兽
-
离婚协议贷款债务如何转移
-
全球焦点!隆鑫通用(603766)6月28日主力资金净买入1658.67万元
-
环球热推荐:刘强东拟出售价值约 2790 万美元京东股票,为其年内第 7 次股权出售
-
全球快消息!迪马:接替奥纳纳,国米有意矿工21岁门将特鲁宾
-
全球观热点:图片报道
-
腾求婚照引争议,肢体动作质疑-世界热点
-
叛乱下场!揭秘普里戈任的俄罗斯商业帝国,千亿资产或面临重组_环球快播
-
人才市场最新招聘信息(人才市场)-全球消息
-
今日有勇无谋是什么生肖(有勇无谋是什么生肖)
-
每日报道:*ST中天终止上市 6月30日摘牌
-
女孩3岁时被判定只能活半年,经上海医生救治今年18岁完成高考-信息
-
全球焦点!苹果4默认铃声叫什么名字_iphone4系统自带的电话铃声有哪些
-
外观优雅 内饰惊艳 长安启源A07官方美图正式发布 热点在线
-
世界快消息!Google招募安全公司来协助扫描Play商店是否存在恶意软件
-
精选!中国联通董事长刘烈宏:加快5G 900MHz低频打底网建设 推动5G-A万兆体验商用
-
注意!华菱精工将于7月31日召开股东大会 当前消息