在新一轮的科技竞争和技术创新当中,大企业的作用显而易见,在带动中小企业和大研究中发挥着引领作用,掌握关键核心技术、走向国际参与竞争,更需要大企业贡献力量。
内容/岚羽
编辑/TV
校对/莽夫
再过不足一月时间,历史的指针将正式指向2024。大模型“井喷”之势下,数字科技在全球新一轮科技浪潮中的趋势与走向,是创新者提前备赛的重要发展指南。
需要进行前情提要的是,数字科技一定是硬科技,但硬科技不等于硬件科技,人工智能、大数据、云计算、区块链、虚拟现实等数字科技也是硬科技。数字技术不仅有很高的技术门槛,同时能够赋能千行百业、提升效率。突破卡脖子技术需要“软硬结合”,硬件技术和数字技术缺一不可。
以大模型浪潮为例,涉及到的即有芯片、服务器、通信网络等硬件领域,也包括云计算、数据库、虚拟化等软件层。短短一年间,大模型已从概念走向业务场景应用,加速通用人工智能演进,过程中国内头部科技厂商起到了引领发展的重要作用。
爆发源于沉淀。这与大企业多年创新积累不无关系,由此才能以“时刻准备着”的姿态抓住窗口期。在推动技术进步的进程中,大企业有自己独特的优势,鼓励大企业发展、努力培育更多在国际市场中有竞争力的大型科技企业,是国际市场竞争战略。
而作为经济发展中最活跃的创新要素,企业创新,才能产业创新。
Part.1
国产大模型百舸争流
加速拓展应用广度与深度
预判2024,大模型是无法回避的话题。过去一年,国内外大模型加速发展。其中,海外市场继GPT-4发布后,OpenAI推出了更强大收费更低的GPT-4 Turbo、人人都可定制的GPTs服务以及GPT商店。除此之外,Google、Anthropic、Cohere、HuggingFace都在不遗余力地推进大模型。
国内市场同样百花齐放,腾讯、阿里、百度、华为、科大讯飞等厂商结合自身业务和战略布局,发布了各自的大模型技术路线与产品。有数据显示,截至10月份国内大模型发布已达238个,国产大模型呈百舸争流之景象。
但无论国内还是国际赛场,大模型的竞赛终归不是闪电战,而是持久战。短期模型发布数量暴涨的背后,大模型的应用方向和商业价值更值得深入探索,“下半场比拼的是场景和应用的落地能力”已成业内共识。
目前来看,大模型产业呈现出通用大模型和领域大模型互促共进的发展态势。通用大模型通常从通用语料训练生成,具备强大的自然语言理解、语言生成和语言识别等能力,在聊天、写诗、作画等泛娱乐场景上表现颇佳。而在更为严肃的工作场景、专业场景里,目前阶段通用大模型无法大面积地胜任,例如法律、医疗、金融等。这是因为通用大模型一般基于公开信息进行训练,在许多专业知识和行业数据方面积累不足。
领域大模型是基于通用大模型灌注行业知识精调形成,能够更好地理解行业的语义和规范,更有效地执行专业性更强的任务。当前很多大厂从基础大模型做起,搭配领域大模型,让人工智能更好地服务于千行百业。
例如,华为在发布盘古大模型后,在医药、气象、金融等领域布局了领域大模型,“盘古药物分子大模型”使先导药的研发周期从数年缩短至数月,研发成本降低70%,“盘古气象大模型”能够提供秒级的全球气象预报。
腾讯方面推出了腾讯混元大模型和腾讯云MaaS(模型即服务)。混元作为腾讯云MaaS的基座,客户可以直接通过API调用混元,也可以将混元作为基底模型,为不同产业场景构建定制化的应用。目前混元已接入腾讯逾300个业务和产品并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯会议等。
从商业化落地情况来看,无论是通用类还是领域类,大模型最根本的出发点是解决产业场景中的实际问题,长远的目标是以人工智能为代表的新一代数字技术引领新一轮的技术发展和产业重塑。但如果始终坚持通用类大模型,即便在100个场景中解决70%-80%的问题,却很难完美解决某个问题;如果始终坚持领域大模型,而在底层模型投入不足的话,未来或许将与第一阵营渐行渐远。
以大模型为代表的人工智能技术应在更加严肃的专业场景和工作场景中真正发挥价值,拓展应用深度;从本文到图像、音视频等更多维度,多模态推动AI应用广度,进而成为新的生产力。在当前竞争阶段,“两条腿走路”的平衡战略或许是最佳选择,只有将通用大模型的能力提升至世界前沿水准,有了较强的基本能力和素质后,才能在不同行业与场景的落地中实现务实创新。
放眼全球,技术进步的速度不会放缓,大模型更是展现出了革命性的技术进步,以人工智能为代表的数字科技正在奔涌向前。跟进与超越,是不可逆的技术洪流。
Part.2
数字科技将成国际竞争重要战场
关键技术应当自主可控
大模型是新型基础设施的关键底座之一,因此大模型的竞争也是国家科技战略的竞争。在大国博弈的背景下,以人工智能、大数据、云计算、区块链等新一代的数字科技将是未来国与国竞争的重要战场。
但新的数字科技既是重大机遇,也是艰难挑战。作为底层技术能力,数字技术势必将向上赋能各行各业,同时助力科学技术发展。但除了像芯片这样的硬件领域,在以大模型、人工智能为代表的数字技术方面也存在“卡脖子”问题。如数据和算力,就是当前想要布局全栈自主创新的大模型产品的主要制约因素。
数据是大模型的基础燃料,决定了模型的训练质量、性能表现和应用领域的广度和深度。但其实国内不缺海量数据,缺的是高质量的中文语料。据国家网信办数据显示,2022年我国数据产量达8.1ZB,位列全球第二;我国数据存储量达724.5EB,全球占比为14.4%。但在ChatGPT大模型训练中,中文占比不到0.1%,这也与中文开源语料库数量少和规模小有关。
值得关注的是,构建中文开源数据集的步伐正在加快。今年以来,《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》中提到,要组织有关机构整合、清洗中文预训练数据,形成安全合规的开放基础训练数据集;持续扩展多模态数据来源,建设高质量的文字、图片、音频、视频等大模型预训练语料库。此外,复旦大学团队开源包含47万高质量监督微调(sft)数据集disc-med-sft,华为诺亚方舟实验室开源第一个亿级中文跨模态数据集。
而算力是大模型完成训练和推理过程的基石,大模型浪潮驱动智能算力需求激增。从算力规模方面看,根据信通院统计,2022年我国算力总规模超150EFLOPS,位居世界第二,并保持高增长速度。
谈算力,芯片禁令是无法回避的话题。但历经多年发展,国产AI高端芯片已取得了长足的进步。面对2个月前的新一轮AI芯片禁令,越来越多从业者选择华为昇腾910等国产芯片进行训练开发。
IDC数据显示,2023年上半年,中国加速芯片的市场规模超过50万张,本土AI芯片品牌出货超过5万张,占整个市场10%左右的份额。国家正在加快推进芯片、云服务等大模型算力基础设施的自主研发和生产,打破国外的技术和供应链封锁,为国产大模型提供可靠且持续的算力支撑。
面对数字技术巨大的价值和应用前景,虽距离世界顶尖水平仍有差距,但国内产业相关主体努力布局前沿、攻克关键技术的步履从未停止。中国数字科技有自己的积累和场景优势,面对大模型为代表的数字技术方面存在的“卡脖子”问题,中国企业正在努力掌握关键核心技术,携手构建自主可控生态,在数字科技领域缩小与世界领先水平的差距。
Part.3
大企业领军参与国际竞争
带动产业链条创新提升
大企业往往在基础研究、原始创新、技术商业落地、高效迭代等能力范畴上表现突出,是创新型企业中的佼佼者。面对更加残酷的国际市场竞争,以及国内科技实力从量的积累迈向质的飞跃、从点的突破迈向系统能力提升的关键节点,应当重视大企业的发展,发挥大企业的作用。
在新时代新征程上,如何让大企业在自主创新中“挑大梁”,发挥大企业承担关键技术攻关、提升创新体系综合效能、参与国际科技和产业竞争的优势,是下一阶段需要思考的重要课题。
当前国产大模型从发布数量上看,与世界先进国家差距不大,但从影响力来看,国产大模型还未形成像ChatGPT、Bert一样的世界性影响力。
这是由于以微软、Google、Salesforce等为代表的科技巨头大量资源资金投入的长期结果,为所在国大模型产业的发展积蓄了力量。如Google长期投身于研究基础理论,最早在2017年提出Transformer网络结构,成为近些年大模型领域大多数企业底层架构的基础。
技术创新有其自身的规律,数字科技具有投入大、高风险、回报周期长等特性。当下的科技创新不仅需要实现“从无到有”的突破,更需要平衡成本、效率、效果的“不可能三角”,解决商业化、市场等一系列应用问题。
企业对于数字科技的投入,应该是在创新中容许适当失败的、长期而又持续的,是既有丰富的市场应用实践,又懂得科技成果转化的。相比之下,大企业在创新投入和创新能力上更有优势,可以形成生态,带动中小企业的创新能力,进而形成创新链条。
就大模型产业而言,训练成本高,研发难度大,“每家一个大模型”不太现实,一定需要一个“大电厂”,以及几个大电厂形成互联互通的算力中心。由此推测,最终的生态应该是由少数几家头部厂商研发基础大模型,中小企业注重精细的部分,高校侧重基础理论的研究,“建立生态+做细应用+对齐科研”才有望在国际和国际市场竞争中赢得大模型产业博弈的弯道超车机会。
目前,国内头部企业正在不断完善AI生态构建。百度推出大模型生态政策;华为鼓励更多伙伴加入盘古大模型全域协同生态体系;腾讯已经与1万1千家生态伙伴展开紧密合作,推出了覆盖100多个产业场景的行业解决方案,腾讯云也发布了“大模型生态计划”。
对于具有丰富行业数据积累的中小企业,可以通过直接调用API或基于GPT大模型微调优化自己的AI产品。然后基于开源模型或海量数据,打造出更专业、更精准的领域大模型,建立垂直行业的平台生态。
因此在当前环境中,应当发展大企业,用大企业领军大研究。大企业有更充足的资金、资源、人才,可持续投入和持续创造,进行多方位甚至是冒险式的研发。在国际市场和国际科技发展中同样如此,没有大企业就很难拥有话语权。应当鼓励企业做强做大,到国际上参与竞争。
根据全国工商联数据显示,2022年中国民营企业中研发投入最多的三家公司分别为华为、腾讯、阿里巴巴,三家企业研发投入合计约占全国总研发经费支出的近7%。在全球企业排名中,三家公司的研发投入均排在前二十位。此外,华为在5G领域的专利数量已经连续多年排名第一,掌握的关键核心技术专利最多;腾讯专利申请数量超6.6万件,全球互联网行业中仅次于谷歌,人工智能专利数超过1万件……
在数字科技等前沿领域的探索中,头部企业往往能够较早布局和规划,例如腾讯早在2018年就开始了大模型训练和推理的研发,并设有实验室专注量子计算、下一代机器人的研究等。
在新一轮的科技竞争和技术创新当中,大企业的作用显而易见,在带动中小企业和大研究中发挥着引领作用,掌握关键核心技术、走向国际参与竞争,更需要大企业贡献力量。
期望在未来的世界舞台上,看到在“以大带小”、“产学研”与“用”互为指导下,越来越多的中国企业身影。
原文标题 : 数字科技竞争白热化,我们需要更多大企业