返回

澜舟科技的Mengzi3-13B正式开源,支持免费商用。

https://www.chatbro.cn/news/661bc8c262b1e099b1dc0579

澜舟科技的Mengzi3-13B模型已经正式在始智AI的wisemodel.cn开源社区平台上进行发布,并且对学术研究界完全开放使用,同时也支持免费的商业用途。该模型采用了Llama架构,并且选用了来自网页、百科、社交媒体、媒体和新闻等多种渠道的高质量语料,以及一些精选的开源数据集作为训练材料。Mengzi3-13B模型在进行多语言的语料训练时,特别针对万亿级别的tokens进行了深入学习,从而在中文处理能力方面表现卓越,同时也具备了良好的多语言处理能力。在参数量不超过20B的轻量化大型模型中,Mengzi3-13B因其在中英文语言处理方面的出色表现而独树一帜,它不仅具有很高的实用性,而且性价比优良,能够很好地满足企业和机构的不同商业需求。