来源: 发布时间:2025-09-08 14:40 点击量:147
【前言】
2024年7月,世界知识产权组织WIPO发布了《生成式人工智能专利态势报告》(以下简称:WIPO报告),报告分析了从2014年至2023年底的十年间,全球生成式人工智能(GenAI)相关专利情况,并给出了权威的结论。WIPO报告显示,在这10年间,全球GenAI相关专利申请有5.4万件,其中中国的专利申请量以3.8万件占据首位,远远超过美国、韩国、日本和印度等国。由于 GenAI 技术呈现井喷式发展,相应的专利申请量也呈现指数式上升,仅2023年公布的 GenAI 相关专利就超过了全部总数的1/4。相应地,GenAI技术淘汰速度也非常快,可以想见过去10年的专利技术,越是新的技术越是具有参考借鉴价值。
本文将沿袭WIPO报告的专利分析思路,聚焦ChatGPT发布后,即2023年1月以后公开的GenAI几个重要中国参与企业和研究机构,进行相关专利数据进行分析,为感兴趣的客户提供参考。
《WIPO报告》显示,在中国的企业中,中国腾讯、平安保险集团和百度在过去 10 年中申请了最多的 GenAI 专利家族。以下将按照《WIPO报告》里面GenAI专利申请量排名,简单介绍这些中国研发实体。
在专利增长方面,GANs专利在过去十年中增长最为强劲。然而,最近这一速度有所放缓。相比之下,扩散模型(DMs)和 LLMs 在过去三年中显示出更高的增长率,扩散模型的专利家族数量从2020年的18个增加到2023年的441个,LLMs的专利家族从2020年53个增加到了2023年881个。显然ChatGPT 等现代聊天机器人引发的 GenAI 热潮显然增加了人们对 DMs和LLMs大模型的研发投入。
腾讯的专利申请量排名第一。腾讯基于其 LLM 大模型“混元”(Tencent Hunyuan)推出了自己的 AI 聊天机器人,该机器人支持图像创建、文案和文本识别等应用。该公司使用“混元”为其旗舰产品。例如在微信里添加了 AI 功能,以改善用户体验。
平安保险的专利申请量排名第二。平安保险的 AI 计划专注于用于承保和风险评估的 GenAI 模型。
百度的专利申请量排名第三。百度是 GenAI 领域最早的参与者之一,最近发布了其最新的基于其文心大模型的 AI 聊天机器人 ERNIE4.0。百度还为 IT、交通或能源等行业开发了多个LLM大模型。
进入前 20 名的其他中国公司还包括阿里巴巴集团(第6)、字节跳动(第9)、步步高电子(第11)、网易(第12)、华为(第14)、中国移动(第17)和国家电网(第18)。
在排名前20名的研发团队中,还有非公司的中国科学院(第4)、清华大学(第15)和浙江大学(第16)等几家科研机构。
具体的GenAI相关专利公开量排名,见下图。
图:《WIPO报告》中 GenAI 相关专利申请人全球排行榜前20
中国企业对GenAI大模型的贡献:
本次文章中,我们研究了《WIPO报告》里面排名靠前的中国公司:腾讯、平安保险、百度、阿里巴巴、字节跳动、华为、中国电网。这几家公司都是行业龙头,并且具有很高知名度和社会影响力。
通过研究这几个排名靠前的国内知名公司在ChatGPT发布前后(即2023年前后)的相关专利公开量,并且根据GenAI各主要大模型加以梳理,形成以下柱状图,直观地展示了腾讯、平安保险、百度、阿里巴巴、字节跳动、华为、中国电网 等公司,于2023年前后在GAN,VAE,LLM,AE,DM 大模型上相关专利公开量。
注
1.2023年前是指:2014年1月1日-2022年12月31日;2023年后是指:2023年1月1日-2024年6月30日。我们将2024年6月30日作为专利统计的截断日,主要是因为有很多2024年下半年申请的专利尚未公开
2.各大模型具体的含义:
· 生成对抗网络 Generative adversarial networks (GAN)
· 变分自编码器 Variational autoencoders (VAE)
· 基于解码器的大型语言模型 decoder-based large language models (decoder-based LLM)
· 自回归模型 Autoregressive models(AM)
· 扩散模型 Diffusion models(DM)
各大模型的技术特点详见:
《生成式人工智能(GenAI+)最新专利技术发展态势系列之一——-GenAI+大模型》
从各大公司的 GAN、VAE、AM 大模型相关专利的申请情况来看:2023年后仅有中国电网在VAE大模型相关专利申请量上有显著增长,其他2023年后的专利申请量没有明显的爆发性上升;AM 大模型相关专利一直只有零星的申请量,比前文分析的国际知名公司还要少;至于GAN 相关专利,中国这几家公司的公开量仍然很高,但是就公开量而言放缓明显,可见中国各大公司在技术转向上紧跟技术发展前沿和国际同步。
以上情况和 GAN、VAE、AM 三个大模型在总体上受到 ChatGPT 发布的影响较小的结论是一致的。以下让我们来看一下受到 ChatGPT 发布的影响较大的 LLM 和 DM 的中国这几家大公司的专利申请情况。
相较于 GAN、VAE、AM 大模型,各大中国公司的 LLM 和 DM 大模型的则在2023年前后受到ChatGPT 的影响非常大。尤其是 LLM 大模型,腾讯、百度和阿里巴巴这几家国内互联网龙头企业在2023年后相关专利申请量成倍数增加;平安保险、华为和中国电网由于其主营业务并非是互联网相关业务,而是其他实体产业,这些大公司从事大模型的研发主要是配合其主营实体产业展开的,因此其LLM 和 DM 大模型相关专利申请量相对较低,是可以理解的;但是由于“字节跳动”作为有社会影响力的互联网多媒体企业,旗下拥有“抖音”、“TikTok”、“今日头条”等诸多知名产品,其相应大模型申请量如此少,是值得研究的一个现象。
中国大学/研究机构对GenAI大模型的贡献:
WIPO报告指出:在所研究的 GenAI 专利里面,除了以上一些行业内知名企业外,大学/研究机构也是智慧贡献的主要力量。《WIPO报告》中 GenAI 相关专利申请人全球排行榜前20里面,有17家是企业;仅有的3所大学,都是中国大学,他们是中国科学院(第4)、清华大学(第15)和浙江大学(第16)。
《WIPO报告》中还专门为全球大学的相关专利申请量做了排名,在所有这些大学/研究机构里面,中国的专利权人处于主导地位,排名前4的都是中国的大学/研究机构,具体排名见下图。
图:《WIPO报告》中 GenAI 相关专利申请人全球大学排行榜前20
中国科学院,600余件专利,位列第一;清华大学和浙江大学都有300余件专利分列2、3位;浙江工业大学 (Zhejiang University of Technology)贡献了近200件专利,位列第4;这几个中国的大学,他们处于第一梯队;美国、韩国、日本和瑞士的一些大学/研究机构,虽然也出现在大学排行榜前20里,但是排名靠后,且其相关专利申请量远低于前4名。因此本文仅研究这4所中国大学相关专利情况。
我们可以通过研究这几个大学的专利,得知其研发方向,以及未来企业可能涉及的应用领域。同时,我们研究大学的专利申请情况,还能为GenAI从业企业未来人才招聘,大学科研项目合作提供参考。各大学的具体专利申请量数据,见下图。
从以上数据统计图中得知:
中国科学院紧跟前沿技术,在五大模型上均有研发投入,且相关专利申请量居于中国大学之冠。究其原因,主要源于以下两个方面:
1. 其研究机构在中国各地布局,有多个研发团队基于当地不同实体产业的需要,进行有针对性的研究;
2. 相对于各大学主要是教学任务不同,中国科学院主要任务是课题研究,其业绩考核也是基于其研发成果进行的。
清华大学作为中国理工科的最高学府,现在在全国也有研究院的布局,和当地政府企业有深度合作。
浙江大学和浙江工业大学,特别值得一提。这两所大学都在杭州。众所周知,由于阿里巴巴在杭州长达20多年的成长,带动了浙江杭州地区互联网相关产业的蓬勃发展。从这两所大学申请的专利主题看,其专利实际应用性强,专利技术更容易商业化。
【结语】
以上的专利统计,是基于专利标题、摘要以及权利要求等信息,进行的专利类型归类。但是,所有GenAI专利家族中有很大一部分不适合任何特定的大模型。许多GenAI专利的标题、摘要以及权利要求不包含特定的大模型关键字,而是专注于描述专利的应用,并且在专利说明书里面只对使用的GenAI过程进行了一般性描述。这使得我们很难将一些专利映射到五个核心GenAI模型,同时这5种不同的大模型在技术解决方案上也有一些重叠。因此以上的统计不免有些失真的情况,但是从总体上而言还是有说服力的。
至此,我们针对各大模型的统计分析到此结束了。今后我们将切换分析维度,对大语言模型训练/处理的数据类型,以及大语言模型的应用领域进行深度分析。敬请期待!