应用无界:智能书写新时代
大家好,我是彭菲,是来自汉王科技的一名人工智能算法工程师。说到人工智能,相信大家都不再陌生了。从AlphaGo战胜围棋冠军,到ChatGPT引发全球热潮,AI正在深刻改变着我们的生活。
作为一名在AI行业摸爬滚打十几年的从业者,我有幸亲眼见证了中国AI的跨越式发展。有人问我:中国AI为什么能发展得这么快?我的回答很简单:“匠心传承、脚踏实地,一步步干出来的”。每一个算法突破的背后,是实验室里千万次的数据调试;每一项技术创新的根基,是研发团队不舍昼夜的集体攻坚;每一次产业升级的动力,是从追赶到超越的执着信念。而我,正是这万千从业者中普通的一员。这份 “干出来” 的信念,其实一直伴随我的成长轨迹中。
一、探索未知,遇见热爱
我在湖南农村长大,父母从小教育我要好好学习,长大做一个对社会有用的人。带着这份朴素的期望,我非常幸运地考上了清华大学,如饥似渴地学习吸收新的知识。当时,我勤工俭学,给清华跳水队的小朋友们当晚自习家教,他们白天要练跳水,晚上还要补功课,非常辛苦。有个小孩跟我说,“老师你知道吗,我的名字一般人不会写也不会念,两个木字中间一个矛字,底下一个心,念懋,我叫施廷懋,我给你签个名,以后我要当世界冠军的,到时候你可以拿签名去炫耀。”然后她就在作业纸上给我签了个名。多年以后,我在电视上看到领奖台上的奥运冠军施廷懋,发出灵魂拷问,我的签名呢?这件小事,给我留下了非常深刻的印象,也带给我特别大的震撼,很幸运自己见证了一个伟大梦想在身边实现。所以说,不要轻视每一个梦想,怀揣梦想的人都值得敬佩。
奥运冠军施廷懋从小就有了自己的梦想,但可能我们大多数人在学校里还不知道自己的梦想是什么。我大学就读于生物医学工程专业,是一个交叉学科,我做过金工实习,也解剖过兔子,学过编程,也去实验室摇过试管。学校也有很多的讲座、选修课,我有空就会去参加各种讲座,选修的课程也把课程表排得满满的,不懂的东西实在太多了,所以就五花八门的什么都想听一听,感受一下。
后来,我慢慢发现自己对计算机视觉领域更加感兴趣。要达成自己的兴趣目标,必须更多地付出和实干。我将方向聚焦在图像处理、模式识别、机器学习这类课程,最后本科毕业时,比学校要求的多修了几十个学分。本科毕设时也选择了医学图像处理这一方向。我的硕士课题也选择了机器学习领域。这些都为我后来进入人工智能领域奠定了专业基础。寻找梦想的过程是从广泛了解到逐渐聚焦的过程,现在还感到迷茫的同学可以多尝试不同的方向,并从中找到自己的兴趣所在。
二、榜样引领,薪火相传
十几年前,人工智能这个概念还不太火,算法工程师这一职业尚属新兴,女性算法工程师更是稀少。但出于对技术的热爱,以及对这个行业未来潜力的坚定信念,我毅然选择了这条道路。临近毕业时,汉王科技发布的全球首款嵌入式人脸识别产品深深吸引了我,我想这项技术在未来肯定有广阔的应用前景,于是我加入了汉王科技,开启了自己的算法工程师生涯,投身人脸识别技术的研发工作。来到汉王后,我发现这家公司是一个名副其实的创新型科技企业。董事长刘迎建更是一名心系祖国的劳模工匠,他几十年如一日地践行“实践出真知”这一句话。
早在1985年,为了解决中国人用键盘输入汉字困难的问题,刘迎建就研发出世界首款联机手写汉字识别装置,后续不断研究能用于书写、绘画并输入电脑的电磁笔。在汉王成立之前,日本一家公司凭借无线无源电磁笔专利,在全球范围内建立垄断地位。从1994年开始,汉王就将目标锁定在“无线无源”这个壁垒上,刘迎建亲自上阵带领团队进行电磁笔与绘画板研发,他说“我们研发队伍很慓悍,有的公司一见核心技术就发憷了,我们则是愈战愈勇。”正是这种“勇敢无畏,干字当先”精神,让汉王在“无线无源”和“微压精密传感”领域突破核心技术,先后获得了国内外专利,打破了国外垄断。到今天,汉王也是世界唯二拥有此核心技术的企业。
刘迎建从未止步于手写识别的创新成就,不断拓展人工智能技术版图,他总爱用胡杨树的故事来说明技术研发要耐得住寂寞,“在戈壁滩,胡杨树要花20年向下扎根,才能在某个雨季突然拔地而起。做硬科技就要像胡杨,耐得住寂寞,等得起周期。”
刘迎建的研发热情和踏实肯干感染了我。我进汉王后的第一个任务,就是人脸识别算法的国产化移植和优化。当时,市面上比较流行的嵌入式芯片是TI的DSP,算力比较强大,汉王当时刚推出的人脸通都是基于DSP平台开发的。但是我们不能完全依赖国外的芯片,要让中国的算法在中国的芯片上运行,我和团队开始了国产化移植优化方案。第一项任务进展并不是很顺利,原来的算法移植到新的平台后,速度很慢。但每次想想前辈们攻克卡脖子的无线无源电磁笔时的难度,以及展现出坚韧不拔的精神,我作为汉王新生代的工程师自然也不能认输。于是,我边查阅论文,学习芯片手册,边设计新的特征方案,希望从算法本身和针对芯片的嵌入式加速两方面来实现我们的目标。每天的时间总是过得很快,有时候不知不觉就工作到很晚。那时候我几乎认识公司的所有员工,并不是我交友广泛,只是因为当时公司员工都参与了测试,存储了人脸照片,我每天看、每天看,看得多了,自然就认识了。经过数十次的算法迭代,我和团队将原有算法提速近十倍,最终实现千元级国产产品替代国外厂商几万元的产品,并且出口到了全球五十多个国家和地区,不仅收获行业好评,还为中国科技产品树立了良好的形象。
我们的人脸识别技术在保障国家安全和服务民生上有广泛的应用。国庆70周年大庆、APEC峰会、G20峰会等很多大型活动使用了我们的技术方案。在幼儿托管机构,我们采用人脸识别技术,小朋友进出都刷一下脸,爸爸妈妈的手机就会收到自家宝贝的照片和位置,就不用再焦虑地问老师有没有接到孩子。我们的北京马拉松比赛,采用人脸识别技术来进行身份核验和定点打卡,防止替跑、绕近等违反比赛规则的不文明现象,促进赛事公平。
三、砥砺前行,科技报国
比科技创新本身更重要的是让技术服务于人类,这是我们科技工作者的共同使命和价值追求。在2016年,我迎来了一个新的挑战。当时,我们接到客户需求,希望利用人工智能技术对输油输气管道进行智能化监控。油气管道作为重要基础设施,铺设长度和方位逐年递增。有些油气管道在大山深处,有些在茫茫戈壁滩,人工巡检管理难度可想而知。如果需要巡检三千公里的管道,每人10公里,需要300人,而且也没办法做到24小时巡检。如果利用机器视觉来实现自动化巡检,不但可以大大提高工作效率,还可以快速地发现隐患,减少经济损失。
为此,我们跟客户反复沟通,到实际场景收集、发掘了大量的应用需求,并根据需求,陆陆续续开发了很多功能,比如烟雾火焰检测、工程车作业检测、管道漏油检测等等。但是研发的道路并不是一帆风顺的,遇到挫折是家常便饭。在烟雾火焰检测算法的研发中,因为数据采集非常有限,很难兼顾所有场景。经常出现实验室有限测试集上效果还不错,但是到现场应用却发生一些漏报和误报。有可能波光粼粼的水面反射着夕阳,又或者云雾缭绕的森林,抑或者晚上的路灯和汽车等,都可能引发报警,或者真正起火时一点点小小的烟雾没有检测出来。对此我们反复校验、测试,审核上千路全天视频,不放过任何一个问题和疑点,逐步丰富数据集,并且采用算法来生成虚拟样本来进行数据扩增,反复测试,一点一点的提升效果。目前,我们的平台已能准确地识别判断监控视频中火灾突发、管道破坏等各种常见的潜在风险,在新疆、四川等多地应用,包括中石油西南油气田、中石化西南油气田、新疆油田、国家管网、晋煤集团、渝川燃气等单位的野外油气管道智能化保障项目。实时对几千公里的野外输油、输气管线提供24小时不间断的智能化保障工作,每年能有效阻止几十起威胁管道安全、城市安全的事件,有效保障了国家财产安全。
四、不惧挑战,未来可期
不惧挑战,才能不断突破自我,创造出新的成果。2022年底,大模型技术兴起,让我们窥探到了通用人工智能的路径,人工智能很可能成为改变未来人类社会和文明发展的关键性技术。我接到任命负责汉王天地大模型的研发。对于一直从事计算机视觉领域算法研发的我来说,大模型这个跨领域任务可谓是一个巨大的挑战。那段日子里,挑灯研读论文、梳理技术脉络成为常态,我在持续的学习中拓展着自己的知识疆界。然而挑战接踵而至:模型安全、幻觉消除、推理速度等难题如浪潮般涌来。置身这场全球AI竞赛中,我们既为日新月异的技术突破感到振奋,也不免被追赶的紧迫感所驱使。常常是刚构思出一个解决方案雏形,就发现已有类似研究发表——这既印证了思路的可取,也鞭策我们要以更快的步伐吸收前沿经验。
2023年10月12日,我们团队的汉王天地大模型发布会如期而至。我们的大模型不仅会进行问答,而且也具备文本、语音和图像的多种模态能力,还在办公、教育、人文、法律等领域展开落地应用。
直到今日,大模型的火热研发潮依然继续,竞争异常激烈。我们沉下心来利用大模型的能力来赋能公司的产品,比如汉王科技的电纸书、教育本、柯氏音血压计等,让很多产品都变得越来越智能起来。曾经的电纸书只是用于阅读,采用黑白电子墨水屏来模拟纸张的效果。2008年,汉王电纸书曾以“电子图书馆”的身份随神舟飞船升上太空,陪伴宇航员的太空生活。而如今,在AI能力的加持下,电纸书摇身一变成了办公助手。我们像在纸质书上一样做笔记、划重点,当遇到不懂的内容,随时可以调出AI助手进行解答;放在书架里很久却没时间阅读的书籍,现在只需一句话,AI就能为你提炼核心内容;会议结束后,电纸书已经完成了会议记录,并自动生成结构化会议纪要,智能识别行动项和关键决议……这就是我们重新定义的电纸办公本——不仅是阅读工具,更是职场人的高效“办公搭子”。
当然,除了对公司核心产品进行大模型赋能外,我们也在积极拓展其他领域的创新应用。以我们的古汉语大模型为例,它不仅能够实现古文与现代白话文之间的高质量互译,还具备古文创作、自动句读、信息抽取等多项功能。目前该模型已在国家图书馆、中国第一历史档案馆等开展落地应用,并凭借其创新性成功入选了《北京市人工智能行业大模型创新应用白皮书》。目前,我们也在积极探索大模型在生物嗅觉、仿生机器人等领域的应用,发挥汉王软硬结合的优势,推动人工智能为实体产业创造更大价值。
同学们,我们每个人都处于人工智能时代的浪潮之中,这是一个变化很快的行业,技术的迭代更新速度令人叹为观止 —— 正如我从业以来就经历了从机器学习到深度学习,再到大模型的变迁。但回望来时路,无论是技术突破还是时代前行,需要科学求真的精神坐标指引方向,更需要踏实肯干的行动去实现。
希望你们以“敢教日月换新天”的豪情,在自己的专业领域开拓进取;以“咬定青山不放松,脚踏实地加油干”为责任担当,为祖国发展贡献青春力量。让我们以开放包容的心态拥抱技术变革,在各行各业共同书写属于新时代青年的精彩篇章!