IT之家7月25日消息,AI竞赛日益激烈,Meta公司昨日推出开源Llama3.1模型之后,法国人工智能初创公司Mistral也加入了竞争行列,推出了新一代旗舰模型MistralLarge2。
模型简介该模型共有1230亿个参数,在代码生成、数学和推理方面比其前身功能更强大,并提供更强大的多语言支持和高级函数调用功能。
MistralLarge2拥有128k的上下文窗口,支持包括中文在内的数十种语言以及80多种编码语言。该模型在MMLU上的准确度达到了84.0%,并在代码生成、推理和多语言支持方面有非常明显的改进。
Mistral公司表示,训练的重点之一是尽量减少模型的幻觉问题。该公司称,Large2接受的训练让它的反应更具辨别力,当它不知道某些事情时,它会承认自己不知道,而不是编造一些看似合理的事情。
开放方式IT之家援引官方新闻稿,亿参数,发布旗舰模型该AI模型的关注点之一,在于“授权开放”非商业研究用途,包括开放权重、支持第三方根据其喜好进行微调(fine-tune)等等。
如果商业/企业想要使用MistralLarge2,需要从Mistral公司购买单独的许可和使用协议。
性能与Llama3.1的4050亿个参数(即指导其性能的内部模型设置)相比,它的参数数量较少,但性能仍接近前者。
MistralLarge2可在公司的主平台上使用,也可通过云合作伙伴使用,它建立在原有Large模型的基础上,带来了先进的多语言功能,并提高了推理、代码生成和数学方面的性能。
官方称其为GPT-4级模型,在多项基准测试中的性能非常接近GPT-4o、Llama3.1-405和Anthropic的Claude3.5Sonnet。
Mistral指出,该产品将继续“推动成本效益、速度和性能的发展”,同时为用户提供新的功能,包括高级函数调用和检索,以构建高性能的人工智能应用。