慧聪led屏网

海康威视徐习明:聚焦感知多模态大模型 为中国制造业发展服务

2026-04-01 17:13 来源:海康威视

近日,第十届中国制造业上市公司价值500强论坛在北京举行。本届论坛由国家级装备制造业智库--机械工业经济管理研究院联合多家***研究机构共同发起,围绕“人工智能与制造业深度融合”等关键议题展开深入交流。

会上,海康威视入选“2025年度中国制造业上市公司价值500强”榜单,并同时荣获“2025,彰显海康威视在制造业价值创造与产业智能化创新领域的成年度产业智能化场景创新标杆“果。

海康威视徐习明:聚焦感知多模态大模型  为中国制造业发展服务

海康威视高级副总裁徐习明受邀出席论坛,并围绕《人工智能赋能先进智造转型》主题发表演讲。他表示,人工智能已成为推动制造业高质量发展的核心引擎。海康威视正全面拥抱技术变革,为制造业数字化转型打造强大的感知层,并聚焦垂类大模型,特别是感知多模态大模型技术,推动AI在制造业场景中的高性价比落地。

海康威视徐习明:聚焦感知多模态大模型  为中国制造业发展服务

以下为演讲内容节选:

尊敬的各位嘉宾,很荣幸和大家分享海康威视在智能制造领域的实践,我的分享会从内部提效和外部赋能两个领域展开。

海康威视起步于视频安防,今天全面布局于智能物联。我们选择智能物联,是认为数字化转型是各行各业未来30年的“厚雪长坡”。在数字化转型领域,有两大核心使能技术,一个是移动互联网,聚焦“人”的数字化,另一个是智能物联,为人以外的物、机、料、法、环实现数字化赋能。

我们的技术底座基于智能感知、人工智能和大数据能力,聚焦电磁波和机械波,全面布局各种物联感知技术,把物理世界映射到数字世界。同时,针对性地打造智能产品的闭环,落地智能物联的场景应用。

智能制造能力是我们发展的基石,很荣幸去年我们的生产基地入选为全国15家首批“领航级智,打造出的解决方案正在对外赋能不能工厂”培育名单,我们在自身的制造基地“以已为田”同行业的制造转型升级。

海康的生产制造是典型的小批量、多批次、大规模定制生产,工厂日均需处理订单1万个,每个订单平均只有约40台,订单定配置比例高达75%,数字化是保障这种复杂制造体系高效运营的我们全面拥抱技术变化,已将大模型应用于公司内部的销售、服务、研基石。在大模型时代,发、制造等華鍪苼只剖进方面面。

海康威视徐习明:聚焦感知多模态大模型  为中国制造业发展服务

而在对外服务时,需明确业务定位、做好选择。企业数字化转型的核心是构建数字世界,让大模型优化控制、迭代升级,让大数据辅助决策、精准洞察,而数字世界由两大核心使能技术构成:一是移动互联网赋能的信息化,实现数据在业务过程中的自然产生,比如说“数据即业务”,人、物、设备全在线。

其应用主要分为工业互联网和场景二是智能物联网,提升企业资产运营效率和现场管理能力,物联两大核心领域。海康聚焦工业互联网的应用提供“眼、耳、鼻、舌、身、意”,打造感知层;在场景物联领域,现场管理、现场数字化是核心需求,海康威视的物联感知加人工智能技术能够很好地实现场最数字化。

去年11月,国务院办公厅也发布了关于场景创新的相关文件。我们看到,在场景数字化领域所从事的实践,正越来越得到政府和各行各业认可。在场景数字化领域,我们会既做系统搭建也构建“眼耳鼻舌身意”等感知层。

在企业尤其是制造业的数字化实践里,我们为用户提供两大价值主张:一是“拉近管理距离”,助力大连锁企业通过智能物联实现集约化效益;二是制造业的工艺、安全生产、设备效率等提升,我们叫提质、增效、降本、安全。

今天大模型来了,在制造业里面怎么应用?我们始终聚焦制造业应用场景,深耕垂类大模型特别是感知多模态大模型,为制造业数智化转型赋能。

过去的大模型是训练的时代,而未来是有效高效推理的时代。我们看到推理的需求,各行各业是不一样的。通用大模型训练与推理成本高,难以高性价比地适配制造业场景,而海康观澜大模型,通过预训练,在感知多模态领域表现优异,且推理成本大幅降低。紧扣制造业提质、降本、增效的核心需求,真正创造实用价值。

我们认为,特定的推理场景、推理价值,是数字化领域的企业未来发展的重要依托,而强大的感知层是制造业数字孪生、具身智能应用的基础。为制造业数字化转型打造强大的感知层,是我们的核心业务定位。在技术布局上,我们从可见光感知起步,持续拓展红外、毫米波雷达、X光、声波等,加上人工智能,为制造业带来了很多变化。

比如在可见光领域,海康机器人的工业相机和视觉算法广泛应用在装备制造和自动化企业。传统的视觉算法在工业检测时需要根据被测物的特征设计和训练模型,保障相当高的准确性和反应的及时性,但这样的代价是柔性不足,难以应对表面划痕、部件破裂等复杂缺陷。而大模型技术可以显著提升检测的泛化能力和置信度,

同时,海康机器人还拓展至机械臂领域,推动制造业具身智能落地,通过感知与控制一体化路径,结合工业相机在机械臂引导定位方面的优势,加快柔性制造应用。

在小模型时代,开箱即用的感知智能比较成熟的主要是人脸、车牌算法。而在制造业,以小型训练完成的算法,泛化性较弱,可能用在一个机台、一个产线可以,但换条线、换一个场景、换一个品类,又要大量的重新训练。

今天大模型带来了很多改变,我们通过小样本的训练,甚至可以做到开箱即用。海康在制造业的很多场景和领域,实现了一系列开箱即用的算法,如包装错放、配件错装等,大幅降低跨产线、跨品类的重复训练成本,

在安全生产方面,通过多模态大模型可以实现智能化监管。例如,自动识别动火作业环境并检查易燃物,监测高空作业人员作业安全。我们可以通过多模态大模型与提示词工程结合进行智能化安全检查,摄像机识别脚手架上有人,自己去进行跟踪,调用登高作业的算法,去看作业区域,判断是否存在未系安全带等隐患。

在机械臂防碰撞场景,我们通过三目立体视觉相机与大模型结合,突破了复杂环境下的识别难题。热成像领域,我们实现从芯片到模组的全链技术自主,红外比色测温技术达到国际先进水平,应用于冶金、电力等行业的高炉监测与工艺优化。

而在声波技术方面,我们有光纤的测温、光纤的听诊。皮带检维修工人的工况是极其恶劣的而且安全隐患很大。我们通过光纤听诊结合大模型分析,实现了皮带机等设备的状态监测,大幅减少了人工巡检工作量。

我们的毫米波雷达技术也应用在了工业避障、测距、定位领域:X光技术深耕工业检,比如检测食品里有没有异物,在高精尖的工艺制造里做深度的检测;超声技术则聚焦无损探伤,比如我们将风机叶片检测时间从12小时压缩至2小时,并推动超声显微镜从实验室设备变成在线检测设备。

我们将持续做好制造业数字李生、具身智能的感知层,在感知之上,构建垂类大模型,构建闭环小应用,为中国制造的发展服务。


免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

慧聪LED屏公众号
慧聪LED屏网公众号

更多资讯!欢迎扫码关注慧聪LED屏网微信公众账号