模型

主流大语言模型与多模态模型 — 简介及官网链接

大语言模型

闭源

GPT-4 / GPT-4o

OpenAI 旗舰多模态模型,支持文本、图像、语音理解与生成。

访问官网 →
开源

LLaMA 3

Meta 开源大模型,8B / 70B / 405B 参数,可本地部署。

访问官网 →
闭源

Claude 4

Anthropic 安全对话模型,擅长长文本理解与代码生成。

访问官网 →
闭源

Gemini 2.5

Google 多模态大模型,原生超长上下文。

访问官网 →
开源

DeepSeek-V3 / R1

高性能 MoE 模型与推理模型,数学与代码能力突出。

访问官网 →
开源

Qwen 2.5

阿里通义千问系列,多语言支持,中文场景表现优异。

访问官网 →
开源

Mistral / Mixtral

高效开源模型,Mixtral 8x7B MoE 引领效率革命。

访问官网 →
开源

GLM-4

智谱 AI 双语大模型,支持多种任务,开放平台 API。

访问官网 →

多模态与图像生成

文生图

Stable Diffusion 3

Stability AI 开源文生图模型,高质量图像生成。

访问官网 →
文生图

DALL-E 3

OpenAI 图像生成模型,与 ChatGPT 深度集成。

访问官网 →
文生视频

Sora

OpenAI 文生视频模型,生成长达一分钟的高质量视频。

访问官网 →
语音

Whisper

OpenAI 开源多语言语音识别模型,99+ 语言转录。

访问 GitHub →
视觉语言

CLIP

OpenAI 多模态对比学习模型,零样本分类能力。

访问官网 →