全球大模型竞赛,美中之外还有谁?
散落在各地的珍珠。
在全球人工智能领域,中美都孕育出了众多表现出色的大模型独角兽。这些企业都在本土市场展现出了强大的创新能力和市场活力,成为全球AI技术发展的领头羊。
当视线扩展到中美之外,尽管AI独角兽企业的涌现没有中美那样频繁,但它们依然像世界各地散落的珍珠,每一颗都以其独特的光芒闪耀着。从欧洲的心脏地带到亚洲的新兴市场,再到北美的科技巨头,这些大模型独角兽的发展轨迹,推动了各自国家和地区的科技创新,而且为全球人工智能技术的发展注入了多元化的视角和创新动力。
这场全球AI竞赛,正变得越来越精彩。
法德争夺“欧洲版OpenAI”
OpenAI作为这次AI热潮的导火索和行业领先者,对行业生态有广泛和深远的影响。后进者们纷纷以OpenAI的成就为目标,致力于开发自己的大模型技术。
在法国,有一家公司被视为OpenAI在欧洲的主要竞争对手,法国总统马克龙称其是“法国天才”。这家备受瞩目的公司名为MistralAI,2023年4月在巴黎成立。MistralAI由前DeepMind和Meta的科学家共同组建,主要聚焦开源模型及企业级服务。
MistralAI开源的Mistral系列大模型受到了业界的广泛赞誉。2024年4月,MistralAI推出了全新专家混合(MoE)大模型Mixtral8x22B磁力链接。该模型在文本生成、问答理解等方面表现出色。Mixtral8x22B的具体特点包括对64K超长上下文的支持,多语言能力,尤其在法语、德语、西班牙语等语言上表现流畅,以及采用Apache2.0开源协议等。与相应规模的开源模型对比,除了部分评测不如CommandR 外,Mixtral8x22B模型在其它结果都大幅领先。
根据社区评测,Mistral8X22B在多项基准测试中的表现超越了当前市场上的主流模型,如GPT-3.5和Llama2(Meta开发的大语言模型),甚至有潜力与OpenAI的最新的GPT-4Turbo相提并论。
这样快速的进步和技术创新也吸引了大量投资者的关注。在该公司B轮融资中筹集到了6亿欧元(约合6.4亿美元或47亿元),新融资使得MistralAI估值达到60亿欧元(约合64亿美元或470亿元)。该轮融资由美国的风险投资公司GeneralCatalyst领投,其他投资者包括Lightspeed、法国巴黎银行、英伟达、Salesforce、三星等。
资本的注入为MistralAI的技术发展提供了强大动力,而该公司在技术合作方面的战略布局同样引人注目。MistralAI与微软建立了长期合作伙伴关系,利用AzureAI的超级计算基础设施进行模型训练,共同为客户提供MIstralAI的模型服务,成为继OpenAI后第二家在微软Azure云平台上提供商业语言模型的公司。
将目光从法国转向欧洲大陆的另一个工业大国——德国,其也有着自己的OpenAI。成立于2019年的人工智能初创公司AlephAlpha,将自身定位为欧洲本地AI技术的领导者。
2023年,AlephAlpha在资本市场上取得了显著成就,当年6月,AlephAlpha获得1亿欧元A 轮融资,晋级德国AI独角兽。2023年底,AlephAlpha宣布完成超5亿美元规模的B轮融资。该轮融资的投资方主要来自于德国本土,由创新园人工智能(Ipai)、博世风险投资(BoschVentures)和施瓦茨集团(SchwarzGroup)的公司领投。
AlephAlpha主打“数据主权”的概念,即存储在某个国家的数据受该国法律的约束,以确保数据的安全性。其生成式人工智能解决方案致力于为企业和政府提供突破性的人工智能技术。
技术层面上,AlephAlpha自研的Luminous系列大语言模型,与ChatGPT的功能类似,提供生成文本/代码、总结内容、翻译等服务。2022年4月,AlephAlpha发布了Luminous系列第一个大语言模型,有130亿、300亿和700亿三种参数。生成内容可解释性是该模型的技术亮点,可以帮助客户确保模型安全、可靠地处理其数据,并对生成的内容进行合理的解释。
Transformer创始八子缔造大模型独角兽
人工智能领域近年来的一系列突破性进展,如ChatGPT很大程度上要归功于一种名为Transformer的模型架构,该架构提供了一种更有效的方式来训练大型语言模型。Transformer在《AttentionisAllYouNeed》论文中首次提出,该论文由8位作者共同撰写。
起初,Transformer模型在谷歌内部迅速流行并得到广泛应用。然而,这一模型在谷歌之外的认知度和应用范围相对有限。为了尽快将想法推向市场,论文的8位作者选择离开原有的研究机构,投身于创业的浪潮中。在这些研究人员的引领下,也诞生了CharacterAI和AdeptAI等初创公司,并迅速成长为市场上的独角兽。
8位作者中,年轻且经验最少的AidanGomez也萌生了离开的想法。AidanGomez出生在加拿大,曾在多伦多大学攻读计算机专业。机缘巧合下,AidanGomez认识了多伦多大学校友华人IvanZhang。两人一拍即合,于是在2019年,Cohere创立于加拿大多伦多。随后在2020年,同样毕业于多伦多大学计算机科学系,曾是谷歌大脑Hinton团队成员的NickFrosst加入了Cohere。值得一提的是,三位创始人均是90后。
AidanGomez意识到,要使大模型技术得到更广泛的应用,需要克服两大障碍:首先是计算资源的限制,构建和训练大模型需要巨大的算力支持;其次是AI技术的高门槛,AI和机器学习领域的专业人才相对稀缺。因此,Cohere的愿景是创建一个平台,消除这些障碍,使得原本只有大公司和专家才能实现的复杂任务变得更加简单和易于访问。
2024年4月,Cohere推出CommandR ,该模型拥有1040亿参数,支持英语、中文、法语、德语等10种语言。在检索增强生成(RAG)能力和工具应用方面取得了突破性进展。据其发布的性能测试数据,在多语言、RAG、工具使用三大模块,CommandR 的性能基本与GPT-4Turbo差不多。
与ChatGPT等大模型内卷ToC市场不同,Cohere专注于ToB市场,利用AI模型为企业应用提供人工智能服务,适用于写作、内容审核、数据分类和信息提取等多种业务应用。
差异化战略也令Cohere在竞争激烈的人工智能市场中脱颖而出。据外媒报道,Cohere已经与Jasper、Salesforce等行业知名企业建立了合作关系。这一战略不仅扩大了Cohere的市场影响力,也为其带来了稳健的收益增长。截至今年3月底,Cohere的年化收入已经达到了3500万美元,显示出公司业务的强劲增长势头。
得益于创始人的学术背景和行业经验,Cohere在早期就获得了众多AI领域重量级人物的支持,包括图灵奖得主GeoffreyHinton、Uber首席科学家RaquelUrtasun、英伟达多伦多研究实验室主任SanjaFidler以及斯坦福教授李飞飞等。
2024年6月,据媒体报道,在拿到英伟达、Salesforce、思科等知名投资方的4.5亿美元融资后,Cohere估值飙升至50亿美元,成为大模型领域的又一独角兽企业。这轮融资不仅为Cohere的进一步发展提供了充足的资金支持,也反映了市场对其技术和愿景的高度认可。
亚洲大模型独角兽多元化崛起
在亚洲,中国的大模型独角兽企业活跃,互联网大厂如百度、阿里、腾讯等凭借在各自领域的深厚积累,积极投身于这场科技竞赛。同时,一些早已声名显赫的大佬,如美团的王慧文、前搜狗CEO王小川等的加入为这场竞赛带来了新的变数,也为AI大模型的发展注入了新的活力。此外,一些新兴的大模型企业,如月之暗面、智谱AI等,也在这场竞赛中崭露头角。它们凭借独特的技术优势,拿到的一笔笔的融资额度不断刷新着记录。
若将目光投向中国之外,AI领域的独角兽企业虽然数量不多,但每家公司都是该地区科技创新的璀璨明珠,具有不可替代的价值和独特性。
印度,全球大模型竞赛,美中之外还有谁?以其庞大的市场和人才储备,孕育出了本土的AI独角兽,成为了技术创新的热土。
根据AMiner发布的《全球十个大模型核心团队成员分析报告》,印度的教育机构在全球AI领域扮演着举足轻重的角色。比如印度理工学院,它为全球十个大模型的核心团队输送了21位杰出人才,虽然仅占总数的2.2%,但这一比例在全球范围内的顶尖高校中已足够引人注目,凸显了印度在培养人工智能领域专业人才方面的显著成就和不懈努力。
2024年是印度AI领域的一个重要转折点,当地AI初创公司Krutrim在完成经纬印度牵头的5000万美元融资后,估值达到了10亿美元的里程碑,正式迈入独角兽企业之列。这一成就不仅彰显了Krutrim的快速成长,也代表了印度在人工智能技术领域取得的又一显著进展。
Krutrim由印度知名企业家、Ola网约车平台的创始人巴维什・阿加瓦尔(BhavishAggarwal)领导,该公司致力于大型语言模型(LLM)技术的开发与推广。公司名称Krutrim在梵语中意为“人工”,该公司还在开发数据中心,并设定了为AI生态系统制造服务器和超级计算机的宏伟目标。
在技术成就方面,Krutrim已经成功推出了同名的大型语言模型。这款模型以印度本土数据为核心,通过使用超过2万亿个语料库进行训练。据悉,Krutrim模型不仅能理解20种印度语言,还能生成包括故事、诗歌在内的多种文本,证明了其在多语言处理和内容创作方面的卓越性能。
从印度转向亚洲的另一端,位于亚洲西部的以色列,不仅属于亚洲版图的一部分,还是亚洲、欧洲和非洲三大洲的交汇点。独特的地理位置赋予了以色列丰富的文化多样性,也为其科技创新提供了独特的视角和机遇。在人工智能领域,以色列正以其深厚的科技创新和国防技术底蕴,孕育出本土AI独角兽企业。
2023年,以色列AI大模型公司AI21Labs在C轮融资中获得1.55亿美元,其估值攀升至14亿美元,跻身独角兽之列。该次投资者包括SamsungNext、英伟达、谷歌等。
AI21Labs成立于2017年,总部位于以色列特拉维夫,由OriGoshen、AmnonShashua教授和斯坦福大学教授YoavShoham于2017年共同创立,其中AmnonShashua是著名自动驾驶巨头Mobileye的联合创始人。
AI21Labs有基础大模型Jurassic-2,开发者平台AI21studio,以及面向消费者的产品Wordtune和WordtuneRead。其中,Jurassic-2专注于“阅读和写作相关用例”,为应对大模型惯有的“幻觉”和可靠性问题,采用了一种创新的解决方案——MRKLSystems。这种方法通过结合一个或多个大型语言模型、外部知识库以及符号推理专家系统,有效降低了模型产生错误信息的风险。
AI视频生成等多点开花
在全球人工智能领域,除了大模型的快速发展外,视频和语音生成技术以及针对特定行业的应用也催生了一批独角兽企业。这些企业以其创新技术和市场潜力赢得了投资者的青睐。
在AI视频生成领域,基于人工智能的视频生成平台Synesia,2023年6月从包括英伟达在内的投资者处获得9,000万美元的融资资金,彼时估值达到10亿美元。
Synesia2017年成立,总部位于英国伦敦,该公司开发的软件可以让人们制作自己的数字化身,用来发表企业演讲、培训视频,甚至可以使用120多种不同的语言来进行演示。Synesia等AI独角兽的诞生也体现了投资者对于AI技术在多媒体内容创作等领域潜力的认可。
同样在英国,另一家AI初创公司Quantexa也在2023年初完成了1.29亿美元的融资,由新加坡主权财富基金GIC领投,现有投资者WarburgPincus、DawnCapital、BritishPatientCapital、EvolutionEquityPartners、HSBC等跟投。这轮融资之后,Quantexa的估值飙升至18亿美元,成为AI领域的又一家独角兽企业。
Quantexa的业务始于金融服务行业,其基于机器学习的方法能够搜索公司数据,寻找欺诈、洗钱和其他非法活动的信号。随着公司技术的发展和市场需求的增长,Quantexa将其业务范围扩展到了医疗保健、政府和保险等其他领域,利用其决策智能技术帮助构建完整的客户档案,了解客户合规性。在政府部门,Quantexa的软件也被用于识别人口贩卖等非法活动。
跨越英吉利海峡,德国也在AI领域积极探索。2024年5月,专注于深度学习的语言人工智能公司DeepL,宣布完成了3亿美元的C轮融资,估值达到了20亿美元。这轮融资由IndexVentures领投,ICONIQGrowth、Teachers'VentureGrowth等也参与其中,标志着DeepL在AI翻译领域的领先地位得到了资本市场的高度认可。
DeepL的发展历程同样充满故事。2008年,前Google科学家GereonFrahling在德国科隆创立了LingueeGmbH,这是DeepL的前身。经过多年的技术积累和创新,2017年,DeepL推出了其翻译器产品,支持包括英语、德语、法语、西班牙语、意大利语、波兰语和荷兰语在内的多种语言翻译。DeepL采用的神经网络技术,能够深入处理和理解语言的上下文,提供高质量的翻译服务,这与传统的基于规则的翻译方法形成了鲜明对比。DeepL的翻译质量在多个评价体系中超越了谷歌翻译、亚马逊翻译、微软翻译以及Facebook翻译等竞争对手,确立了其在AI翻译领域的领先地位。
这些AI独角兽企业,作为行业的佼佼者,虽然在商业化路径、解决方案和技术创新上各有侧重点,但它们都秉承着共同的目标:解决现有大模型的挑战,突破局限。企业都在积极探索如何利用人工智能技术满足特定的市场需求,无论是在提高大模型的准确性、降低运算成本、还是增强模型的可解释性和安全性方面。展望未来,随着技术的持续进步和全球化趋势的加强,这些AI独角兽企业预期将不断扩大其全球影响力,推动行业向更高效、更智能的方向发展。