炒股配资交易平台_排名前三炒股配资_股票配资
你的位置:炒股配资交易平台_排名前三炒股配资_股票配资 > 股票配资 > 股票最基础知识入门 通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
股票最基础知识入门 通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
发布日期:2024-08-11 10:57    点击次数:149

IT之家 6 月 7 日消息,通义千问(Qwen)今天宣布经过数月的努力股票最基础知识入门,Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级,并已在 Hugging Face 和 ModelScope 上同步开源。

IT之家附上 Qwen 2.0 主要内容如下:

5 个尺寸的预训练和指令微调模型,包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B

在中文英语的基础上,训练数据中增加了 27 种语言相关的高质量数据;

多个评测基准上的领先表现;

代码和数学能力显著提升;

增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。

模型基础信息

Qwen2 系列包含 5 个尺寸的预训练和指令微调模型,其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。

模型Qwen2-0.5BQwen2-1.5BQwen2-7BQwen2-57B-A14BQwen2-72B参数量0.49B1.54B7.07B57.41B72.71B非 Embedding 参数量0.35B1.31B5.98B56.32B70.21BGQATrueTrueTrueTrueTrueTie EmbeddingTrueTrueFalseFalseFalse上下文长度32K32K128K64K128K

在 Qwen1.5 系列中,只有 32B 和 110B 的模型使用了 GQA。这一次,所有尺寸的模型都使用了 GQA,以便让大家体验到 GQA 带来的推理加速和显存占用降低的优势。

模型评测

相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。

在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。

IT之家附上参考地址

你好股票最基础知识入门,Qwen2

","del":0,"gnid":"95dbda8ce5084a2d1","img_data":[{"flag":"2","img":[{"desc":"","height":"577","title":"","url":"http://p9.img.360kuai.com/t11508c75c89831a84906d832a6.jpg","width":"1440"},{"desc":"","height":"576","title":"","url":"http://p9.img.360kuai.com/t11508c75c802c54e57e5750c2b.jpg","width":"1024"},{"desc":"","height":"576","title":"","url":"http://p9.img.360kuai.com/t11508c75c818942af37095a3ba.jpg","width":"1024"},{"desc":"","height":"527","title":"","url":"http://p9.img.360kuai.com/t11508c75c80dc22c4d5b57219f.jpg","width":"1024"},{"desc":"","height":"1016","title":"","url":"http://p9.img.360kuai.com/t11508c75c844bd06a567b92482.jpg","width":"1024"}]}],"original":0,"pat":"zzc,art_src_1,fts0,sts0","powerby":"cache","pub_time":1717689600000,"pure":"","rawurl":"http://zm.news.so.com/c351a64d36f1b7a3a7defad58234a6c1","redirect":0,"rptid":"5e61a48febaf62e2","rss_ext":[],"s":"t","src":"IT之家","tag":[],"title":"通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens","type":"zmt","wapurl":"http://zm.news.so.com/c351a64d36f1b7a3a7defad58234a6c1","ytag":"科技:人工智能:AI技术","zmt":{"brand":{},"cert":"IT之家官方账号","desc":"爱科技,爱这里 - 前沿科技人气平台","fans_num":29241,"id":"2951916302","is_brand":"0","name":"IT之家","new_verify":"5","pic":"https://p0.img.360kuai.com/t01d48572270765952c.jpg","real":1,"textimg":"https://p9.img.360kuai.com/bl/0_3/t017c4d51e87f46986f.png","verify":"0"},"zmt_status":0}","errmsg":"","errno":0}

上一篇:八戒策略 济南高新区网络安全公共服务平台将上线,全角度全链条赋能发展
下一篇:恒瑞财富网 科技早报:特斯拉FSD升级|英伟达市值破3万亿美元|苹果Vision Pro售价超2万

友情链接: