让人工智能惠及千行百业、千家万户
一、跑出人工智能的中国速度
同学们,当你用大模型查阅文献、构思论文方向,当你在AI科学计算平台上探索新材料的分子组成,当你打开地图APP规划出行路线,当你用翻译软件种草外语电影……你是否想过,这些在当下被视为理所当然的日常操作,在不久之前,还是科幻小说和电影中所畅想的美好未来?
大模型、AI科学计算、地图路线规划、机器翻译,等等,都是当下典型的人工智能技术和应用。人工智能的目标,是模拟、延伸和拓展人的智能。人的智能,涵盖了人方方面面的能力,既包括听、说、看等感知能力,也包括理解、记忆、逻辑、思考等认知能力。而人工智能涉及了计算机科学、语言学、数学、心理学、哲学等等学科。经过近70年的发展,人工智能技术从规则方法、统计机器学习,发展到以神经网络为核心的深度学习阶段。人工神经网络的发明,正是受到生物神经网络的启发。大模型的出现,使得人工智能技术的通用性越来越强,能力越来越全面,已经让我们看到通用人工智能的曙光。
今天,中国的人工智能,从关键核心技术,到智能新应用,从传统产业转型,到新业态新模式,以风驰电掣的中国速度,不断创新突破,为全球人工智能的健康有序发展贡献了中国智慧。在竞争最激烈的大模型领域,2022年11月ChatGPT发布,4个月后文心一言发布,大模型如雨后春笋般涌现。时至今日,中国的大模型从技术能力、落地应用,到开源生态,已与美国平分秋色、各具优势;根据斯坦福2025年人工智能指数报告,2023年,中国在全球人工智能论文及引用量的占比分别为23.2%和22.6%,领先所有国家;在“卡脖子”的AI芯片领域,国产芯片取得系列突破,已部分完成国产替代;制造领域,AI质检、智能排产排程,帮助提升产品质量和生产效率;金融领域,智能客服、智能风控,帮助降低运营成本,控制资产风险;医疗领域,智能辅助诊断、新药研发,帮助提升诊疗质量,维护病患生命健康;教育领域,智慧教学、个性化学习,帮助提升教学质量和学习效率,实现真正的因材施教……
我是王海峰,一名人工智能科技工作者。我见证也亲身参与了中国人工智能从跟跑到并跑,再到部分领域领跑的伟大征程。我在人工智能领域的奋斗经历,不仅关乎我个人的成长,更是一群人用激情和热血书写的时代篇章。
二、传承务实创新、敢想敢干的科研精神
首先,跟同学们分享一张非常有历史意义的照片。大家看照片中比人还高的像实验柜的机器,有人知道是什么吗?它就是中国第一台能下棋、会说话的模拟计算机,1958年诞生于我的母校哈尔滨工业大学,就在美国学者提出“人工智能”概念的两年后。这是当时哈工大计算机专业的学生,凭着年轻人敢想敢干的精神,在时任教研室主任陈光熙教授及其他老师的支持和指导下,只用了56天就做出来的,作为献给国庆节的礼物。这在今天看起来显得笨重、已经过时的技术,是老一辈科技工作者在一穷二白的科研条件下,经过艰苦奋斗取得的成果,为我国计算机及人工智能技术的发展奠定了基础。他们对技术创新的执着,敢想敢干的信念,是我受益终生的宝贵财富。
1989年我踏入哈工大,成为计算机专业的一名学生,光熙先生求实创新、探索进取的科研精神,深深鼓舞、激励着我。1993年进入学校的机器翻译实验室,我参与的第一个项目,就是汉英机器翻译实用系统。机器翻译是人工智能领域经典的研究方向,贯穿了人工智能的发展历程。从那以后,我一边致力于科学研究的创新突破,一边努力推动技术的实用化。
记得博士期间,我接触到了当时比较前沿的神经网络方法。今天大家耳熟能详的深度学习,通常来讲就是庞大的神经网络。我敏锐地捕捉到这种方法的新颖和先进,决定探索神经网络和机器翻译的结合创新。但当时国内还没有相关的研究,就连介绍神经网络技术的书籍都很少;而当时的算力水平也不足以支撑复杂的神经网络运算。在我的导师李生和高文教授的支持下,我专程跑到北京等地查阅外文文献,以有限的算力和数据反复做实验,验证了在机器翻译中引入循环神经网络的可行性。那时我坚信,这个方向能行,一定能行!
从那以后,我一直深耕机器翻译研究,终于在2011年6月,推动“百度翻译”成功上线,我当时很激动地跟团队说:“从事这个领域18年,我们过去一周服务的用户量,比我过去18年服务的用户总和还多。”这也是我第一次感受到“自己的技术有很多人用”的欣喜和自豪。2015年,“百度神经网络机器翻译系统”成功上线,领先谷歌16个月,在全球率先实现神经网络机器翻译的大规模产业应用。今天,百度翻译已支持200多种语言,每天翻译超千亿字符。人类跨越语言鸿沟,自由沟通交流的梦想,正在照进现实。
三、深度学习领域的奋起直追
秉持着“科技报国,技术为更多人用”的执着信念,在进入产业界后,我始终坚持让人工智能的技术开发离用户更近,致力于技术的大规模产业应用。然而科技创新的过程,从来不是一帆风顺。人工智能的发展,曾经几起几落,尤其需要坚韧和坚守。
大家都知道,深度学习是现在人工智能的关键核心技术,有很强的通用性。2011年,我们感知到深度学习技术日益进步,可能成为国际竞争的关键胜负手。2012年初,我带队开启了基于深度学习的语音识别技术研发,并在取得预期效果后,陆续扩展到图像、机器翻译、搜索等方向。随着研发的深入,各方向都在从零开始定制自己的深度学习模型,存在大量的重复造轮子,既影响研发效率,又浪费研发资源。基于这样的业务需求,百度自主研制了飞桨深度学习框架,并于2016年开源。
深度学习框架是支撑深度学习模型开发、训练、推理及硬件适配的基础软件,相当于人工智能的操作系统。当时国内80%以上的开发者在使用国外的深度学习框架,谷歌的TensorFlow和Meta的PyTorch占据了优势。
我带领团队开始了飞桨的奋起直追之路,潜心在关键核心技术上创新突破,面向中国开发者和真实产业需求打造灵活、易用、高效的工具、组件和平台。同时,也与高校、企业、科研机构、开发者等紧密合作,培育人才,建设开源开放的人工智能生态。追赶的过程是煎熬的,也是充满斗志和充实的。团队里有年轻的工程师彻夜在客户的现场改代码、修bug,有运营同学一周要跑不同的城市谈生态合作,有技术攻坚过程中效果反复不稳定,有用户数据一段时间增长缓慢……每当这个时候,我都会对大家说,“相信我们的判断,认定是正确的路就要坚持走下去。过程中有失败、有停滞都是正常的,重要的是要分析问题、解决问题,保持定力,坚持到底。”
2019年,我们举办了首届深度学习开发者峰会,我提出了“深度学习推动人工智能进入工业大生产阶段”,“深度学习框架是智能时代的操作系统”等观点,得到了产业界的共鸣。在团队的努力下,飞桨的技术能力、使用体验和用户规模一路向上。2021年,飞桨已经超过TensorFlow和PyTorch,跃居中国深度学习平台市场综合份额第一。今天,飞桨不仅在大规模深度学习训练和推理等核心技术上国际领先,也建设了繁荣的人工智能生态,累计服务开发者超过2000万,企业67万家,基于飞桨创建的模型110万,有力支撑了我国人工智能技术的自主创新和产业发展。
四、在大语言模型的交锋中敢于亮剑
另一个人工智能奋起直追的领域就是大模型。随着深度学习技术快速进步,2019年,我带领团队研制了文心知识增强大模型,在国际权威技术评测中夺冠,被《麻省理工科技评论》称为“AI理解语言的新思路”。2022年11月, ChatGPT的发布,在全球掀起了研制大语言模型的热潮。2023年春节刚过,百度正式启动攻坚大语言模型。
攻坚战的那段时间,团队拼着一股劲向前冲刺。很多同学小病不下火线,有时就直接睡在地板上,醒了接着干。中间也有进展不顺利的时候。项目一开始,我们对自有模型和ChatGPT做了评测,有差距,但落后不多,我们有信心很快赶上。经过两个星期的攻坚,模型效果跟自己比提升了30%,跟ChatGPT相比差距却拉大了。大家本来很有信心和斗志,看到这个结果像是被当头打了一棒。我当时也挺受冲击的,但冷静下来分析,这个结果证明了我们这两个星期做的事情是对的,同时也要看到别人比我们的进步更大,那就意味着进步的空间还有很大,而且我们已经找到了方法,知道我们走在正确的路上。
终于,历经40多天的连续奋战,2023年3月16日,新一代知识增强大语言模型“文心一言”成功发布。在以人工智能为代表的世界科技竞争主赛场上,中国科技力量直面对手,不再只是看客和跟随者。
中国人工智能,从追赶,到并肩,再到部分超越,是几代人踏踏实实干出来的。我们的每一次努力,都在为中国人工智能的发展添砖加瓦。在这个过程中,我也收获了个人的成功和认可,让我深刻感受到个人成长与国家强大紧密相联。
同学们,你们是新时代的青年,是祖国未来的希望。你们终将离开校园,投身到科技发展日新月异、创新创造风起云涌的时代大潮中去。希望同学们能怀揣梦想,勇于探索,为中国科技事业贡献自己的力量。
请允许我引用今年4月份习近平总书记视察人工智能企业时的讲话,与同学们共勉。“人工智能是年轻的事业,也是年轻人的事业。我们正在全面推进强国建设、民族复兴伟业,正是年轻一代展示才华、大显身手的好时候。”