编辑
2025-09-12
记录知识
0

LLaVA是一种多模态大模型,其可以将输入的视觉特征提取成本文信息,jetson ai lab提供了相关教程,本文实践一下