国内 AI 大模型“安卓时刻”到来!阿里云通义千问免费、开源、可商用
大模型激战之际,继海外的 Meta 之后,阿里巴巴成为又一家推动人工智能(AI)大模型 " 安卓时刻 " 潮流的科技巨头。
8 月 3 日周四,阿里云将 70 亿参数的通义千问模型开源,包括通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。这两款模型均已上线国内首个 " 模型即服务 " 开放平台魔搭社区,开源、免费、可商用。
开源代码支持对 Qwen-7B 和 Qwen-7B-Chat 的量化,支持用户在消费级显卡上部署和运行模型。用户既可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用 Qwen-7B 和 Qwen-7B-Chat,阿里云为用户提供包括模型训练、推理、部署、精调等在内的服务。
(资料图片)
魔塔社区已有发帖,专门介绍通义千问上述模型的安装、创空间体验、模型推理、模型训练最佳实践,并附有模型链接及下载情况截图。
公开资料显示,Qwen-7B 使用去重及过滤后超过 2.2 万亿 tokens 的数据进行预训练,是支持中、英等多种语言的基座模型,上下文窗口长度达到 8k。它包含高质量中、英、多语言、代码、数学等数据,囊括全网文本、百科、书籍、代码、数学及各个领域垂类。评测英文综合能力的基准评测之一 MMLU 的评测结果显示,在英文评测方面,Qwen-7B 的效果超过了目前国内外其他同类开源预训练模型,对比更大规模版本的模型也具有较强竞争力。中文评测方面,在 C-Eval 验证集上,Qwen-7B 在同等规模现有模型中取得了最高分数,甚至相比更大规模模型也具有较强竞争力。
以下为 Qwen-7B 的 MMLU 5-shot 准确率结果对比。
在 Qwen-7B 的基础上,阿里云使用对齐机制打造了基于基座模型的 AI 助手 Qwen-7B-Chat。它是基于 Transformer 的中英文对话大语言模型,已实现与人类认知对齐。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。无论是在 C-Eval 验证集上,还是在 MMLU 评测集上,Qwen-7B-Chat 模型的 zero-shot 准确率均在同类对齐模型中表现较优。
以下为 C-Eval 测试集上的 zero-shot 准确率结果对比。
通义千问的开源后,阿里云成为国内首个加入大模型开源行列的大型科技企业。今年 7 月,微软宣布,联手 Meta 发布开源 AI 模型的可商用版本 Llama 2,提供 OpenAI 和谷歌模型的平替产品。也是在 7 月,智谱 AI 及清华 KEG 实验室公布,中国顶尖开源大模型ChatGLM2-6B 允许免费商用。华尔街见闻此前文章提及,开源模型的好处包括用户的接受率更高,然后输入更多数据供人工智能处理。LLM 拥有的数据越多,其功能就越强大。此外,开源模型使研究人员和开发人员能够发现和解决漏洞,同时提高技术和安全性。
今年 4 月的 2023 阿里云峰会上,阿里巴巴宣布向企业开放通义千问,企业可以调用通义千问的能力训练自己的大模型。
阿里云智能集团首席技术官(CTO)周靖人当时介绍,未来企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自身的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI 设计师、自动驾驶模型等。
阿里巴巴集团 CEO 兼阿里云智能集团 CEO 张勇当时称,阿里巴巴所有产品未来都将接入通义千问大模型。
张勇表示,面向 AI 时代,所有产品都值得用大模型重做一次,而基于这一信念,阿里云也希望帮助更多企业用上大模型,让每家企业都能基于通义千问,拥有具备自己行业能力的专属大模型。关键词:
相关阅读
-
国内 AI 大模型“安卓时刻”到来!阿...
大模型激战之际,继海外的Meta之后,阿里巴巴成为又一家推动人工智能( -
意媒:追求斯卡马卡和莫拉塔受挫,罗马...
据意大利媒体《全市场》报道,罗马希望在夏窗补强锋线,在追求莫拉塔、 -
中国气象局:世界正经历以全球变暖为显...
中国气象局科技与气候变化司副司长张兴赢在发布会上表示,今年入夏以来 -
福特汽车F-150 Lightning皮卡生产重启...
福特汽车位于美国密歇根州的Rouge电动汽车中心(REVC)在经过6周的停产 -
公安部:目前我国机动车保有量达4.3亿辆...
公安部8月3日召开“服务保障高质量发展”专题新闻发布会,公安部交... -
“乳”此珍贵 贵阳妇幼举办最美孕妈...
8月2日,贵阳市妇幼保健院团委联合乳腺甲状腺科、产科、孕产保健部、产 -
天亿马:拟向激励对象21人授予限制性股...
每经AI快讯,天亿马(SZ301178,收盘价:30 4元)8月3日晚间发布公告称 -
上海警方严打各类违法犯罪:命案8年全破...
今天是第五个上海“刑警803”主题日,上海市公安局召开新闻发布会。... -
威力传动(300904.SZ)IPO认购结果:网上...
格隆汇8月3日丨威力传动(300904 SZ)公布首次公开发行股票并在创业板上 -
西安曲江控股补充披露10亿元超短期融资...
回函补充披露了主要参股公司持股比例、部分公司持股比例超过50%但未纳 -
飞利浦 Hue 首款监控产品曝光 摄像头...
飞利浦Hue计划进军安防领域,并将推出首款监控产品,这一消息由Signify -
乔帅官宣球队情况!满意热身赛+球队进步...
今天是男篮赶赴意大利的日子,这种情况下,乔帅更新了自己球队的最新情 -
“卡努”仍在靠近,浙江发布风暴潮红色...
海上台风警报01台风位置今年第6号台风“卡努”(强台风级)今天15时... -
原中央委员受审,曾是末任铁道部长,多...
又一正部级“老虎”今天受审。8月3日,原中国铁路总公司党组书记、... -
魔怨攻略,破解魔怨游戏攻略
1 游戏布景介绍魔怨是一款高智商人物扮演游戏,在游戏中玩家需求扮演一 -
河北丰宁:“税力量”助力风电产业“顺...
在河北丰宁坝上山区,一排排高大的风车迎风矗立,一扇扇硕大的叶片随风 -
龙岗如何稳住经济高质量发展“基本盘”?
龙岗如何稳住经济高质量发展“基本盘”?,招商,制造业,工业区,龙岗... -
吉林桦甸农商行围绕“田园牧歌·小菜园...
年初以来,吉林桦甸农商行坚定不移“以客户为中心”的营销理念,积... -
北京怀柔区台关路北宅1号桥封闭通行
据@怀柔公路消息,受强降雨引发的洪水冲刷,7月31日20时40分,怀柔区台 -
广东省市场监管局关于20批次食品不合格...
2023年8月2日,广东省市场监督管理局网站发布关于20批次食品不合格情况