1. 首页 > TMT资讯

百川智能推出70亿参数量中英文预训练大模型 王小川:第一个里程碑

   盈媒网6月15日,下午消息,搜狗创始人王小川创立百川智能公司,宣布推出了70亿参数量的中英文预训练大模型——baichuan-7B。目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平台发布。

  开源地址:

  Hugging Face:https://huggingface.co/baichuan-inc/baichuan-7B

  Github:https://github.com/baichuan-inc/baichuan-7B

  Model Scope:https://modelscope.cn/models/baichuan-inc/baichuan-7B/summary

  百川智能CEO王小川表示:“本次开源模型发布是百川智能成立2个月后的第一个里程碑,对百川智能而言是一个良好的开局。baichuan-7B模型,不仅能为中国的AGI事业添砖加瓦,也为世界大模型开源社区贡献了新的力量。”

  据介绍,baichuan-7B此次开源内容十分丰富,包含了推理代码、INT4量化实现、微调代码,以及预训练模型的权重。其中,微调代码方便用户对模型进行调整和优化;推理代码与INT4量化实现则有助于开发者低成本地进行模型的部署和应用;预训练模型权重开源后,用户则可以直接使用预训练模型进行各种实验研究。

  在商业化方面,baichuan-7B代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。北京大学和清华大学已率先使用baichuan-7B模型推进相关研究工作,并计划在未来与百川智能深入合作,共同推动baichuan-7B模型的应用和发展。

  清华大学互联网司法研究院院长、计算机系教授刘奕群认为, baichuan-7B模型在中文上的效果表现十分出色,它免费商用的开源方式展现出开放的态度,不仅贡献社区,也推动技术发展。团队计划基于baichuan-7B模型开展司法人工智能领域的相关研究。 

本文不代表盈媒网立场,转载联系作者并注明出处:https://www.yingpost.com/tmt/394.html

联系我们

微信:yingpost2023

Email:396500216@qq.com