以机器人模型为抓手
四川须夯实人工智能领域多样性数据基础
四川须夯实人工智能领域多样性数据基础
决定机器人智能水平的不仅是算法与算力,更有其训练和迭代所依赖的多样性数据的广度与质量。需要从战略高度重新审视数据资源的建设,将系统性采集、治理和开放应用多样性数据作为提升人工智能深度服务产业能力的基础性工程
可在政策层面提早布局,引导人工智能产业不断完善;在技术层面上,探索开放和封闭共存,形成共享和保密并重的技术发展模式
当前,全球正迎来智能机器人技术与产业融合的爆发期,机器人成为全社会关注的焦点。该产业已经从标准化产线走向了柔性制造车间,从结构化场景步入开放复杂环境。四川作为中国西部经济大省和农业大省,工业门类齐备、特色突出,也是全国十三个粮食主产省份之一、五大牧区之一、四大育制种省份之一。抢抓此轮科技革命与产业变革机遇,发展机器人产业与应用在四川有着坚实基础和迫切需求,对推进新型工业化、农业现代化,加快高质量发展,也具有至关重要的战略意义。
要使机器人真正深度服务产业,必须清醒认识到,决定其智能水平的不仅是算法与算力,更有其训练和迭代所依赖的多样性数据的广度与质量。与传统局限于数字世界的软件人工智能不同,机器人模型必须完成“感知—决策—控制”的完整闭环,这需要面对开放环境所具有的高度复杂性和不确定性,要求机器人的数据训练必须跨越单一视角、单一模态和单一时间点,形成跨视角、跨模态、跨时域的多样性数据训练体系。
例如,真实农业环境具有高度的复杂性和不确定性,存在作物形态千差万别、生长环境因地域和气候而异、作业条件复杂多变等困难因素。如果一个采摘或巡检机器人仅基于某一特定农场、单一季节、少数几种作物的数据进行训练,那么将它部署到新的环境中时,其性能必然会急剧下降,甚至完全失效。唯有基于多地域、多季节、多作物、多天气条件的海量、多样性的数据做持续训练与迭代,机器人模型才能获得足够的泛化能力和鲁棒性,即在面对异常数据或环境变化时仍能保持稳定表现,成为靠得住的解决方案。
上文所列举的智慧农业面临的挑战,只是整个机器人产业应用的缩影。在工业制造、应急救灾、医疗康复、家庭服务、银发经济等诸多领域,机器人面临的现实复杂性本质是相通的。缺乏高质量、多维度的多样性数据,再先进的算法也如同“无米之巧妇”,难以孕育出真正实用、可靠的智能。因此,需要从战略高度重新审视数据资源的建设,将系统性采集、治理和开放应用多样性数据作为提升人工智能深度服务产业能力的基础性工程。
为应对上述挑战,建议政策层面提早布局,引导人工智能产业不断完善。一是政府层面统筹协调,鼓励、引导并支持产业链中的企业、高校科研院所与大型农场、智能制造工厂等具体应用场景方建立共享数据库,共同针对重点产业方向,系统规划、标准先行,开展多样性数据的协同采集与标注,打破数据壁垒。二是开放相关工业、农业、服务业等的丰富应用场景,鼓励机器人在真实复杂环境中进行部署测试与数据迭代。通过“揭榜挂帅”等方式,支持企业在此过程中持续收集、沉淀和优化多样性数据,形成良性循环。三是支持建设面向机器人训练的专用数据平台与高性能计算中心,重点聚焦视觉、力觉、触觉、声音等跨模态数据的融合处理与仿真生成能力。利用仿真技术模拟极端、罕见场景,低成本、高效率地扩充数据多样性。
技术层面上,探索开放和封闭共存,形成共享和保密并重的技术发展模式。一方面,通用性数据和模型要秉承开放的态度。当前很多企业投资在做重复建模,浪费巨大,亟须在技术上构建标准模型库向全社会开放。常见的目标,如交通场景下,人、车和宠物等运动对象;农业场景下,果树果实、粮食作物和园艺作物;工厂环境下,容器、工人、包装盒;表演场景下,楼梯台阶、石头障碍等,这些模型相对被人熟知。另一方面,特定商业模型采用技术封闭研发,以便通过商业价值提供持续研究的动力。例如识别假币、早期皮肤病等。封闭的模型设定时效性,分出等级,可以在商业价值衰退时解密,发挥其模型的社会价值,以便开展学术研究。
多样性数据作为人工智能基础设施,如何安全使用同样重要。一是对公民隐私的多样性数据采集和建模要慎重。人脸识别的滥用、虹膜和指纹的随意性采集以及手写字体的机械手书写等方面要加以警惕。法律制度方面要不断收紧,防止个人隐私的非法使用。二是杜绝涉及伦理权利的多样性数据采集和非法建模。例如,人体三维激光点云数据、数字人模拟声音数据、照片修改为动态夸张视频的数据,这些数据除了广播方式展示外,不能用于控制机器人硬件,否则隐患无穷,应该早做立法准备以便从容应对。
机器人是人工智能深度服务产业的“先锋队”和“试金石”。其智能水平的每一次跃升,都深深植根于多样性数据的沃土。四川必须紧紧抓住机器人模型这一具体抓手,前瞻布局、汇聚数据、开放场景、创新生态,将产业应用优势转化为数据资源优势,再将数据优势转化为机器人智能优势和产业发展盛势。同时在产业发展初期,扬长避短,深挖洞广积粮,先做好战略准备和技术储备,如此,方能在这场智能革命的竞争中抢占先机,为多产业高质量发展注入强大的智能动力。(马伟 作者系中国农业大学工学院教授,中国农业科学院都市农业研究所首席科学家)