发表评论取消回复
相关阅读
相关 多模态模型:概述
![format_png][] 多模态模型是一种机器学习模型,它可以同时处理多种不同类型的数据,例如文本、图像、声音或者视频。这种模型能够更好地捕捉多种数据之间的关系,并且有
相关 多模态模型原理
多模态模型是一种在不同模态之间转换的模型。模态是指不同的数据表示方式或不同的输入/输出模式。例如,文本、语音和图像都是不同的模态。 一个多模态模型可以在不同的模态之间转换,从
相关 AI-多模态-文本->图像-2022:Midjourney
Midjourney 会发布新的模型版本,以提高效率,相干性和质量。最新的模型是默认模型,但是可以使用–version或-v参数或使用 /settings命令和选择模型版本使用
相关 AI-多模态-文本->图像-2021:Stable Diffusion【开源】【目前开源模型中最强】
最近大火的Stable Diffusion也开源了(20220823); 我也本地化测试了一下效果确实比Dall-E mini强太多了,对于我们这些玩不上Dall-E2的这个
相关 AI-多模态-2021:ALIGN【】
[https://arxiv.org/abs/2102.05918][https_arxiv.org_abs_2102.05918] 【写在前面】 学习良好的视觉和视觉
相关 AI-多模态-2021:ALBEF
■ 简介 大规模的视觉和语言表示学习在许多vision-language任务上取得了很大的进步。现有的方法大多用一个以transformer为基础的多模态编码器来联合建模
相关 AI-多模态-2021:SLIP【对CLIP的改进】
论文地址:https://arxiv.org/abs/2112.12750v1 项目地址:https://github.com/facebookresearch/SLIP
相关 AI-多模态-文本->图像-2021:DALL-E模型【OpenAI】
Dall-e:从拟物文字到图片的创造 人类不断地从五种感官接收和整合信息,通过视觉、听觉、触觉、嗅觉和味觉等生物信息来理解文字和图片。然而文字和图片属于符号,Dall-e
相关 AI-多模态-2021:CLIP模型【OpenAI】【连接语言与视觉】【对比学习】
[GitHub - openai/CLIP: Contrastive Language-Image Pretraining][GitHub - openai_CLIP_ Con
还没有评论,来说两句吧...