从“雾里看花”到“火眼金睛”,AI赋能安防视频“视”界革新
自以ChatGPT为代表的AI大模型问世以来,生成式AI迅速崛起为主流技术。紧随其后的是,科技巨头们搭乘时代的高速列车,纷纷投身于大模型的发展浪潮之中。
近两年来,大模型如雨后春笋般涌现,并迅速渗透到各类终端和产业领域,呈现出井喷式的发展态势。伴随着各大厂商纷纷推出大模型产品的浪潮兴起,紧接着的焦点无疑在于如何有效地将这些大模型应用于实际场景中,并充分发挥其效能。
在这场竞赛中,安防作为人工智能领域最早深度落地的行业,从传统安防到智能物联,一直在不断拓展自身边界和应用场景。如今,随着大模型时代的到来,安防行业又一次站在了技术创新与应用的前沿阵地,智能安防与大模型的融合之路正在逐渐步入正轨,同时也在逐步接受大模型所带来的种种变革。
安防视频之困:“雾里看花”难题多
近年来,随着人们生活水平的不断提升以及对家庭安防需求的日益增强,网络监控摄像机凭借其便捷高效等特点已悄然走进千家万户,成为现代家庭守护安宁的得力助手。
不过,在科技日新月异的当下,消费者对于网络摄像头的期待已远不止于简单的画面捕捉,他们更渴望摄像机能够具备更多智能识别能力,精准捕捉到人物移动、宠物出现等关键信息,并将这些重要的视频内容实时推送至手机端,以便让身处远方的他们也能在第一时间掌握家中的每一个细微动态。
然而,目前市面上绝大部分网络监控摄像机所采用的传统移动侦测方案,只能机械地感知画面中的元素是否发生了位移,而无法真正理解画面背后的丰富内涵与情感色彩。这种技术的局限性,也会导致摄像机在上报视频时难免出现部分误报的情况,给消费者带来了不必要的困扰。
另一方面,在当前消费电子行业的安防场景中,监控摄像头的使用场景愈加广泛,数量增多,以及摄像头使用时长增长,一天所产生的平均视频时长往往可达2小时以上甚至更长,从而使得视频的数据呈爆炸式增长。面对如此冗长繁杂的视频素材,用户想要从中精准筛选出自己真正关心、需要的内容,如同大海捞针。这不仅极大地降低了使用体验,也让网络摄像头的安防价值大打折扣。
面对这一痛点问题,如何打破这一技术瓶颈,实现智能识别与精准推送,是当前安防领域亟待解决的一大难题。
大模型加持,TWeSee让安防视频更“有看头”
对此,腾讯云RTC-IoT基于自研多模态大模型,推出全新的TWeSee解决方案,智能分析理解画面内容,在传统移动侦测方案的基础上,进一步提供视频浓缩、视频摘要、视频搜索、视频标签等能力,精准总结并索引视频内容,彻底改变了只能依靠人工查看的人机交互模式。
根据了解,TWeSee凭借视频浓缩、视频摘要、视频搜索、视频标签等能力,为IPC用户提供智能化的视频分析体验。用户通过摘要后的文字便能快速把握视频的精髓,并且也能利用自然语言技术进行视频搜索。面对海量的视频数据,用户同样能够依靠精确的索引功能,迅速锁定自己所需的视频片段。
图源:腾讯云音视频公众号
在视频摘要方面,借助自研大模型强大的长视频语义理解能力,TWeSee能够精准识别视频中的人、车、宠物、包裹等对象,检测火焰、烟雾、天气、颜色、运动等各种信息,并针对不同场景(入户场景、室内场景、户外场景等),智能提取事件要点,总结成文字摘要。这样,用户无需浏览整段视频,仅凭视频文字摘要,即可快速掌握视频内容概要。
在视频搜索方面,融合AI技术与视频语义理解能力,TWeSee支持用户通过自然语言进行视频搜索,极大地拓宽了搜索的边界。用户只需用自然语言简述自己想要的视频内容,无需费时费力逐一浏览视频,TWeSee就能够在海量云存储视频资料中智能筛选出与用户描述文本相契合的视频片段。比如,用户输入关键词“狗狗”,TWeSee就会自动检索今天的视频内容,并精准找出“狗狗躺在沙发旁”、“狗狗在窗前玩皮球”等场景的相关视频片段。
在实时推送方面,结合TWeSee精准的视频理解和文字摘要能力,厂商能够将摄像头监控到的重点事件通过文字消息的形式,实时推送给用户。用户可以通过推送的文字摘要内容,再决定是否进一步查看对应事件视频。这一实时消息推送功能让用户无需耗时浏览视频,就能第一时间掌握到家中的实时动态。此外,用户还能自定义感兴趣的视频标签,确保摄像头仅在捕捉到相关场景时才发送通知。比如,为宠物设置“特别关注”,这样当摄像头捕捉到宠物相关视频时,便会立即推送消息通知用户,确保用户不会错过宠物的每一个精彩瞬间。
据悉,TWeSee解决方案已在技威时代旗下IPC产品中广泛应用,为超过1.2亿“有看头”App用户深度赋能,提供智能化的视频管理体验,让安防视频更有看头。
除了全新发布的TWeSee解决方案,腾讯云RTC-IoT还面向设备开发商提供了一站式音视频物联PaaS解决方案。基于RTC-IoT提供的设备端、APP和微信小程序SDK,设备开发商可快速落地项目,实现视频连接、存储和智能应用等多项服务,安全且高效。
图源:腾讯云音视频公众号
写在最后
一直以来,安防行业被视为人工智能强应用的领域之一。如今,随着大模型技术的进一步发展,尤其是多模态大模型的应用,安防系统正逐步跨越传统视觉监控的界限,迈向深度内容解析、高度场景适应性以及丰富人机交互的新阶段。而未来,可以预见的是,大模型的应用将带动更多创新技术融合并更快速、更广泛地赋能更多细分场景应用,助力安防行业挖掘出更深层次的创新空间与市场潜力。