盖世汽车 刘丽婷2025-12-04
盖世汽车讯 视觉语言模型(VLM)是现代人工智能(AI)的核心技术,可用于表示不同形式的表达或学习内容,例如照片、插图和草图。它具有很强的泛化能力,使其能够准确识别特定领域内图像中的物体。然而,这种泛化能力也存在风险。例如,VLM 可以将真实车辆和插图车辆都识别为“车辆”。
如果将这种模型应用于实际系统中,则存在将路边广告中的插图车辆误认为真实车辆,从而导致严重交通事故的风险。为了将安全可靠的人工智能应用于实际,必须建立能够根据应用场景适当控制学习知识的技术。

图片来源: 东京理科大学
刘丽婷


全球视野,中国声音,快来体验吧