会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 AI大模子的语言不同过错等:英语最重价,此外语言要贵良多!

AI大模子的语言不同过错等:英语最重价,此外语言要贵良多

时间:2024-10-27 18:18:51 来源:东风谷静芙网 作者:探索 阅读:695次

原问题:AI大模子的大模的语语言不同过错等  :英语最重价,此外语言要贵良多

7 月 31 日新闻  ,言不英语言贵用户所运用的同过语言对于大型语言模子(LLM)的用度有很大的影响,可能组成英语运用者以及此外语言运用者之间的最重家养智能边界 。最近的外语一项钻研展现  ,由于 OpenAI 等效率所接管的良多的效率器老本掂量以及计费的方式,英语输入以及输入的大模的语用度要比其余语言低良多 ,其中简体中文的言不英语言贵用度约莫是英语的两倍 ,西班牙语是同过英语的 1.5 倍,而缅甸的最重掸语则是英语的 15 倍。

IT之家留意到  ,外语推特用户 Dylan Patel(@dlan522p)分享了一张照片,良多揭示了牛津大学妨碍的大模的语一项钻研,该钻研发现 ,言不英语言贵让一个 LLM 处置一句缅甸语句子需要 198 个词元(tokens)  ,同过而同样的句子用英语写惟独要 17 个词元 。词元代表了经由 API(如 OpenAI 的 ChatGPT 或者 Anthropic 的 Claude 2)碰头 LLM 所需的合计力老本 ,这象征着缅甸语句子运用这种效率的老本比英语句子逾越 11 倍 。

词元化模子(即家养智能公司将用户输入转换为合计老本的方式)象征着 ,除了英语之外的其余语言运用以及磨炼模子要贵良多。这是由于像中文这样的语言有着差距 、更重大的妄想(不论是从语法仍是字符数目上)  ,导致它们需要更高的词元化率 。好比,凭证 OpenAI 的 GPT3 分词器  ,“你的爱意(your affection)”的词元,在英语中惟独要两个词元  ,但在简体中文中需要八个词元 。尽管简体中文文本惟独 4 个字符(你的爱意),而英文有 14 个字符。

【源头 :IT之家】返回搜狐 ,魔难更多

责任编纂:

(责任编辑:综合)

推荐内容
  • 双塔威猛!森林狼撕碎灰熊领跑联盟,爱德华兹伤退,李凯尔准三双
  • 总决赛G5裁判陈说出炉!最后两分钟4次错漏判 无碍掘金夺队史首冠
  • 追光丨缔造历史 张之臻很“清静”
  • 马刺民间祝愿名宿布鲁斯
  • CBA最新积分榜,广东升第二,浙江第三,深圳第七,山东两连胜
  • 生涯饮食罕有的6大养生缺陷 饮食养生要留意甚么?