图像生成、识别与编辑分类精选
图像识别、分析与多模态理解
Google 的多模态 AI 助手
高性能云原生向量数据库,面向大规模向量检索与 ANN 搜索
sglang 是 GitHub 开源项目,主要聚焦图像与视觉能力
vllm-omni 是 GitHub 开源项目,主要聚焦开发者工程能力、图像与视觉能力、视频生成与处理、语音与音频处理
通过提示词生成插画、海报与素材图像
图片修复、局部编辑与风格迁移