「教科书级」数据能有多大熏染?微软超强小模子引热议
随着大模子掀起新一轮 AI 热潮,教科人们开始思考:大模子的书级数据强盛能耐源头于甚么 ?
之后 ,大模子不断在由不断削减的熏染小模「大数据」来增长。「大模子 + 大数据」彷佛已经成为构建模子的微软尺度范式。但随着模子规模以及数据量的超强不断削减 ,算力的引热议需要会快捷缩短。一些钻研者试验探究新思绪 。教科
6 月 ,书级数据微软宣告了一篇题为《Textbooks Are All You Need》的熏染小模论文,用规模仅为 7B token 的微软「教科书品质」数据磨炼了一个 1.3B 参数的模子 ——phi-1。尽管在数据集以及模子巨细方面比竞品模子小多少个数目级,超强但 phi-1 在 HumanEval 的引热议 pass@1 上抵达了 50.6% 的精确率 ,在 MBPP 上抵达了 55.5% 。教科
phi-1 证实高品质的书级数据「小数据」可能让模子具备精采的功能 。最近,熏染小模微软又宣告了论文《Textbooks Are All You Need II: phi-1.5 technical report》,对于高品质「小数据」的后劲做了进一步钻研。
论文地址 :https://arxiv.org/abs/2309.05463
模子简介
架构
钻研团队运用 phi-1 的钻研措施 ,并将钻研重点放在做作语言知识推理使命上,建树了具备 1.3B 参数的 Transformer 架构语言模子 phi-1.5。phi-1.5 的架构与 phi-1 残缺相同 ,有 24 层 ,32 个头 ,每一个头的维度为 64,并运用旋转维度为 32 的旋转嵌入,高下文长度为 2048 。
此外 ,该钻研还运用 flash-attention 妨碍磨炼减速,并运用 codegen-mono 的 tokenizer 。
磨炼数据
phi-1.5 的磨炼数据是由 phi-1 的磨炼数据(7B token)以及新建树的「教科书品质」数据(约莫 20B token)组成的 。其中,新建树的「教科书品质」数据旨在让模子把握知识推理 ,钻研团队精心筛选了 20K 个主题来天生新数据 。
值患上留意的是,为了品评辩说收集数据(LLM 罕用)的紧张性,该钻研还构建了 phi-1.5-web-only 以及 phi-1.5-web 两个模子。
钻研团队展现:建树强盛且周全的数据集需要的不光是原始合计能耐 ,还需要重大的迭代、实用的主题抉择 ,以及对于知识的深入清晰 ,具备这些因素,能耐确保数据的品质以及多样性。
试验服从
对于语言清晰使命,该钻研在多个数据集(搜罗 PIQA、Hellaswag、OpenbookQA、SQUAD 以及 MMLU)上评估了一些模子 。评估服从如下表 3 所示,phi-1.5 的功能可能媲美 5 倍大的模子:
在知识推理基准上的测试服从如下表所示:
在更重大的推理使命(好比小学数学以及根基编码使命)上 phi-1.5 还逾越了大少数 LLM:
钻研团队以为,phi-1.5 再次证明了高品质「小数据」的实力。
质疑与品评辩说
概况是由于「大模子 + 大数据」的理念太深入夷易近意,这项钻研受到了机械学习社区一些钻研职员的质疑 ,致使有人怀疑 phi-1.5 直接在测试基准数据集上磨炼了 。
网友 Susan Zhang 妨碍了一系列验证,并指出 :「phi-1.5 可能对于 GSM8K 数据会集的原下场给出残缺精确的回覆 ,但惟独稍微更正一下格式(好比换行) ,phi-1.5 就不会回覆了 。」
尚有更正下场中的数据,phi-1.5 在解答下场的历程中就会泛起「幻觉」 。好比,在一个点餐下场中,只更正了「披萨的价钱」,phi-1.5 的解答就泛起了过错 。
而且 ,phi-1.5 彷佛「记住了」最终谜底,纵然在修正数据的情景下该谜底已经是过错的 。
对于此 ,论文作者之一 Ronen Eldan 很快给出了回应 ,针对于上述网友测试泛起的下场给出批注以及反驳:
但该网友再次剖析其意见 :测试剖析 phi-1.5 的回覆对于 prompt 的格式黑白常「单薄结子」的,并对于作者的回应提出质疑:
论文第一作者 Yuanzhi Li 回应道:「由于不妨碍任何指令微调以及对于齐使命 ,phi-1.5 在安妥性上简直不如 GPT-4。但『单薄结子』并非精确的术语 ,事实上 ,对于任何模子,pass@k 精确率都市比 pass@1 高良多(以是模子精确便是无意偶尔的)。」
看到这些质疑与品评辩说,网友们直呼 :「最重大的回应方式便是直接果真分解数据集 。」
对于此,你奈何样看?
参考链接 :https://twitter.com/suchenzang/status/1701615026648605095
(责任编辑:时尚)
- ·末节17分,狂轰35+6+7!塔图姆挺身而出,东部黑马轰然倒下狂砍62+10+12!杜兰特布克打疯了,你要觉醒巅峰,三巨头才能夺冠
- ·施拉德:凯恩有可能延长合同,鲁梅尼格能否邀请库利巴利?球后2023-11-16 22:23上海球后2023-11-16 22:23上海
- ·让约基奇空砍26+16+18!鹈鹕3人得分20+,5连败后连赢独行侠掘金
- ·你的猛龙 独一无二,哈弗猛龙广州车展展现独特产品价值英国男子脸部畸形,靠才华迎娶美女大学生,孩子出生后笑不出来了
- ·CBA综合:北控赢得“京城德比” 辽宁豪取九连胜唐三到底有多怂,小舞生气前后差异明显,动作姿态很卑微
- ·【现场】哈登重返布鲁克林遭嘘 平民篮网掀翻快艇7年前,重庆小伙娶了法国美女,生下两个混血儿子,后来结局如何
- ·西媒:卡马文加韧带的伤情颇为罕有 必需接受非老例手术
- ·原创 2-3!欧冠7冠王轰然倒下,58%控球被射19脚,双线溃败,欧冠悬了
- ·原创 三年级孩子早恋怎么教育 大黄蜂老师给你这样说
- ·婚车遇上高考车队 新郎下车发喜糖 网友:车内前途似锦 车外百年好合
- ·曝哈登欲罢不能!留费城冲冠仍是回休城当老大?名记:他很纠结
- ·国米大胜重返榜首,AC米兰客场落败
- ·霍华德:还没从NBA退役,违心辅助国王争冠
- ·男足亚运队3位超龄球员确定:放弃武磊3大原因存在争议!伊万卡未处理就遭暴露的照片:如此真实的身材,真是别有滋味!
- ·米兰VS拉齐奥首发曝光:托纳利坐镇,三大帝星领衔中场,吉鲁冲锋90年代,陶虹年轻时的照片,此时身穿红色泳装摆出妖娆姿势
- ·灰熊又出手做空商汤,空头资本们为啥总是盯着中概股不放?一安徽农民因长相酷似普京,一夜走红,俄罗斯人:真的太像了
- ·惨烈!保罗恐遭无情裁掉,下家赔率湖人第一!
- ·原创 双曲线二号复用火箭有多成功?已超过SpaceX蚱蜢火箭第7跳的表现
- ·中国女足留洋球员再添一人 肖裕仪租借加盟澳超球队为什么古人常言黄鼠狼不可杀?科学研究表明,原来真的不能杀
- ·[瞎话板]哈斯勒姆上场29秒,投篮1中0,患上到总决赛最老球员出战记实
- ·澳超赛事前瞻:卫冕冠军西部联本赛季饱受伤病所扰将清明上河图放大100倍,发现一尴尬场景:树下睡觉的男子在干嘛
- ·体坛联播|高亭宇速滑世界杯夺金,拜仁曼联阿森纳集体输球澎湃新闻2023-12-10 09:23澎湃新闻2023-12-10 09:23
- ·战报|掘金109:94客场扑灭热火,约基奇超级三双再创历史23岁网红死于酒店浴缸,体内残留11人DNA竟无一人获罪,这是为何
- ·哥哥拿弟弟身份证高考 8点45分才发现
- ·盘点网文白金作者老鹰吃小鸡挖呀挖黄老师已39岁,真容被嘲像嫩牛五方,榜一大哥“连夜逃跑”
- ·交易哈利伯顿!名记曝旧料,曾报价哈登,篮网却选择拒绝张靓颖:被骗财骗色15年,为其打乳钉,最后支付了6个亿的分手费
- ·信谁的?太阳队记:报道有误 太阳还未对于保罗的未来做出抉择