阿里通义千问大模型负责人周畅将离职创业氪独家
作者|邓咏仪周鑫雨
编辑|苏建勋杨轩
36氪独家获悉,阿里通义千问大模型技术负责人周畅(花名:钟煌)将从阿里云离职,下场创业。
36氪了解到,阿里通义千问大模型负责人周畅将离职创业氪独家周畅目前还在阿里云系统中,尚未正式离职。但36氪从多方独立信源处得知,周畅已确定要创业。一位消息人士对36氪表示,周畅或将投身于AI应用领域。
而另一位知情人士表示,周畅是通义实验室算法团队的核心技术骨干之一,属于正常离职。通义大模型的研发和开源工作还在进行中,目前通义实验室负责人为阿里云CTO周靖人。
对于上述信息,36氪向阿里云求证,截至发稿,暂无回复。
周畅为“通义千问”的大模型负责人,他于2012年本科毕业于复旦计算机科学与技术专业,2017年博士毕业于北京大学计算机软件与理论专业,而后加入阿里巴巴。他先后在达摩院任职算法专家,再到通义千问的大模型负责人。其专攻领域为深度学习、图挖掘和分布式计算,他在机器学习、数据挖掘、数据库领域国际顶级会议上发表30余篇文章,并担任NeurIPS/ICML/KDD/WWW等学术会议的审稿人。
阿里是国内最早成体系地投入在大模型领域里投入研发的大公司。2019年,阿里就在BERT路线的基础上推出了预训练大语言模型structBERT,而后在2021年推出了多模态大模型M6,再到如今的通义大模型家族。
达摩院下属的通义实验室,也是如今大模型圈内的“人才高地”。如前不久官宣创业的前字节模型技术研发负责人杨红霞,已加入Salesforce的前任实验室负责人司罗、通义视觉实验室负责人徐盈辉等等,都出自达摩院体系,这都是培养起阿里大模型团队的第一批顶尖AI人才。
周畅则是完整经历过阿里大模型演变历程的核心技术骨干。在2020-2021年间,他带领团队设计并实现了超大规模的多模态预训练模型M6,在参数数量和低碳训练模式上曾取得突破。
而更早之前,他曾研发超大规模商品图表征算法APP、用户表征框架ATRank、基于自监督对比学习的向量召回算法CLRec系列,这些技术都有落地到实际应用场景中——比如在手淘多个个性化推荐场景下,让效果获得大幅提升。
进入2024年,国内大模型行业已经进入走过萌芽期,基础大模型层已经格局出现——玩家包括大厂如阿里、字节、腾讯,创业公司如智谱AI、Minimax、月之暗面、百川智能等。市场普遍将关注度放在了AI应用一侧,关注大模型如何落地到千行百业中,这也会带动新一波AI人才的创业热潮。