您现在的位置是: 首页» 舆论引导

《人民邮电》(薛新龙、陈润恺) 如何提升我国人工智能产业国际竞争力

发布日期:2023-12-11

(来源:《人民邮电》 第5版 专家视点)

薛新龙 陈润恺

人工智能正在深刻改变生产生活的各个领域,尤其是ChatGPT问世以来,国际社会对人工智能技术的关注和期待空前高涨,新的技术样态与商业模式不断涌现。英国《经济学人》调查显示,仅2023年上半年,全球人工智能企业就吸引了超过400亿美元的风险投资,相关产业正处于快速变革和激烈竞争阶段。我国应紧跟国际人工智能产业发展趋势,积极采取措施应对竞争与挑战。

全球人工智能产业蓬勃发展

算力竞争——降本增效成为首要任务。

算力是制约人工智能发展的首要因素,模型的训练和运行需要庞大的计算资源。根据分析机构SemiAnalysis的数据,GPT-4的训练过程投入了约25000颗英伟达A100芯片,单次训练成本高达6300万美元。成本压力导致许多公司延缓新一代模型的研发,例如,OpenAI公司经过权衡,选择将现有的GPT-4模型优化至GPT-4.5版本,而非直接开发GPT-5模型。但这也为谷歌等财力雄厚的竞争对手创造了竞争空间,其计划推出的Gemini模型有望在性能上超越OpenAI的现有产品。

因此,降低算力成本、提高计算效率已成为人工智能企业普遍面临的问题。具体而言,一是加强芯片新架构的研发,以集成芯片、光芯片和类脑芯片为代表的新一代芯片技术,具有提升良率、提高传导效率、低能耗和自适应学习等优点,正引领行业发展的新方向。二是优化算力资源管理,增强调度能力。通过GPU资源池化等方式,实现资源并行使用,不仅提升算力利用率,还能有效降低硬件消耗和缩短调度时间。三是利用绿色电力或可再生能源为模型训练和运行提供算力,从而降低碳排放,提高能源效率。

数据争夺——拓展来源渠道丰富数据形式。

数据是决定人工智能竞争力的关键,优质、丰富的数据能够显著提高模型的理解力和内容生成精度。在技术快速发展的驱动下,企业对数据的渴求日益强烈。谷歌和Meta等科技巨头的最新模型已经接受了超过1万亿单词的训练,相当于250多个英语版维基百科的内容。研究机构Epoch AI预计,可用于训练的高质量文本库可能在2026年之前耗尽。

为获取更多优质的数据,人工智能企业在拓展数据来源形式方面展开了激烈的竞争。一是与专业机构签约,拓展数据来源渠道,通过与新闻、摄影、科研机构合作,将视频、音频、图像等形式的数据纳入训练范围,提升数据专业度,让模型更准确地回答与特定领域相关的问题,例如,OpenAI通过与美联社和图库Shutterstock合作,利用其数据库提升模型的训练质量;二是开发“合成”训练数据,利用算法生成的模拟数据,可以有效解决由于数据安全、隐私保护、采集成本等造成的数据来源不足问题,例如在训练自动驾驶汽车的图像识别系统时,可以使用合成数据模拟各种复杂的道路条件、天气变化和交通状态,不仅提高了数据的多样性,还大大降低了数据的采集成本;三是积极利用用户与软件的交互数据,企业通过在软件中建立反馈机制了解用户对生成内容的满意度,这些反馈数据将被用于模型的再次训练,形成所谓的“数据飞轮”,谷歌就通过分析用户是否复制翻译文本判断生成内容的可靠性,据此改进产品。

商业创新——从吸引公众用户转向打造专业社群。

打造专业社群正成为国际人工智能企业的发展策略。相比公众用户,专业用户对产品的需求更为稳定、具有更高的付费能力,倾向于与模型制造者建立长期合作,共同解决问题和改进模型。这种策略有助于深化企业与用户的互动,增强产品的市场黏性和用户忠诚度。同时,专业社群的构建也为企业提供了持续的数据流和反馈,极大促进了产品的优化与创新。

具体模式上:一是从研发通用模型转变为专用模型,相较于通用模型,专用模型在算力成本和资源消耗上更具优势,更适应特定领域的需求。例如,微软基于GitHub(软件代码存储库)开发的编程辅助工具,以及谷歌对BERT模型进行微调所形成的文本摘要和翻译模型T5均属这一类型。二是从面向公众用户转变为面向企业用户,随着市场逐渐成熟,企业开始倾向于提供商用的付费服务,而不再试图通过免费或低价的产品吸引大量用户。OpenAI就将其模型授权给包括摩根士丹利、Salesforce在内的企业,为其打造更契合业务需求的定制化工具。

并举提升产业竞争力

我国应在进一步加大核心技术的研发力度、加强算力基础设施建设、促进算力资源有效配置和高效运用、提升数据运算能力和业务处理能力的基础上,从数据资源、专业模型和商业模式等方面持续提升人工智能产业的国际竞争力。

丰富数据资源,保障供给质量和规模。加快培育数据要素市场,鼓励人工智能基础数据服务商开发数据标注和清洗服务,提升数据的应用价值,重视专业领域数据集开发,鼓励专业机构、行业组织、科研院所提供高质量、高信任度的专业数据;积极推进各类数据资源的开发利用,建立健全公共数据资源目录和开放清单,根据数据敏感度构建有条件多层次的公共数据开放格局,细化个人信息数据处理规则,探索个人信息相对匿名化路径,为企业提供明确清晰的合指引,提高数据处理效率;拓展数据来源新渠道,发展合成数据训练技术,通过模拟器模拟、算法合成、数据增强等方式,扩充模型训练数据集,支持模型训练的多样化需求。

培育专业模型,提升人工智能应用能力。开发专业模型是提升产品应用效率和行业渗透力的有效途径。相对通用模型,专业化模型的计算成本较低,可使用较少的参数和计算资源来训练和运行,并且能够根据具体应用场景、知识体系和行业需求进行定制,提供更多的专业化解决方案,满足不同用户的需求。因此,推动发展行业和垂直领域大模型对提高人工智能的行业应用能力至关重要。具体而言,一方面应加强专业化模型的开发、测试,提供反馈和评价,促进专业化模型的持续优化和迭代;另一方面,要创造安全高效的研发与应用环境,推动医疗、金融等关键领域数据的开发利用,支持模型与具体场景深度融合,持续推动各领域的数智化转型。

创新商业模式,打造可持续发展生态系统。商业模式创新将有助于促进技术成果的转化,提升产品与服务的附加值,增强企业竞争力。应推动人工智能企业从提供单一产品或服务转向构建多元、开放、协同的人工智能生态系统。培育以开源社区为代表的人工智能产业生态体系,通过为开发者提供工具和资源,吸引更多专业用户。根据市场需求,提供多样化订阅服务,提高客户满意度和忠诚度。利用人工智能技术发挥数据赋能作用,提供营销、管理、研发等决策支持,为客户提供个性化、差异化、专业化的解决方案。同时鼓励跨机构跨领域合作,与政府、学术机构、行业协会等建立良好的合作关系,共同推进人工智能领域政策、标准、法规的制定与实施.

(作者单位:对外经济贸易大学国家对外开放研究院)

附:原文链接

https://rmydb.cnii.com.cn/html/2023/20231207/20231207_005/20231207_005_05_809.html