总结
- 图像 / 视频理解模型 GLM-4V-Plus:具备卓越的图像理解能力,并具备基于时间采集的视频理解能力。 除此之外,智谱还宣布在清言 App 上线了视频通话功能,这是国内首个面向 C 端用户开放的视频通话服务。 智谱表示,GLM-4-Plus 基础模型在各项指标上,实现与 GPT-4o 等第一blog.byteway.net梯队模型持平。 此外,在 GLM-4-Plus 模型的训练过程中,智谱通过采用更精准的长短文本数据混合策略,显著增强了模型在长文本推理方面的表现Ligthing News。 对于 CogView-3-Plus,智谱采用 Transformer 架构替代了传统的 UNet 架构来训练扩散模型,并深入研究了扩散模型的噪声规划,其效果目前接近一线水平的 MJ-V6 和 FLUX 等模Ligthing News型。
阅读时间
- 5 分钟, 共 904 字
分类
- bigmodel.cn, 开源, 8 月, 2024, 4
评价和解读
- 作者对该主题的深入而微妙的处理在这篇富有洞察力和信息性的文章中显而易见。
正文
感谢IT之家网友 有鲫雪狐 的线索投递!
IT之家 8 月 29 日消息,智谱 AI 在 KDD 2024 大会上发布了新一代基础模型,自称在相应领域均达到了国际第一梯队的水准,并宣布在 MaaS 平台上免费开放 GLM-4-Flash API:
-
语言模型 GLM-4-Plus:在语言理解、指令遵循、长文本处理等方面性能得到全面提升。
-
文生图模型 CogView-3-Plus:具备与当前最上面的 MJ-V6 和 FLUX 等模型接近的性能。
-
图像 / 视频理解模型 GLM-4V-Plus:具备卓越的图像理解能力,并具备基于时间采集的视频理解能力。该模型将上线开放平台(bigmodel.cn),并成为国内首个通用视频理解能力模型 API。
-
视频生成模型 CogVideoX:在发布并开源 2B 版本后,5B 版本也正式开源,其性能进一步增强。
-
GLM-4-Flash API:推理服务免费,并提供完全强大的服务。
除此之外,智谱还宣布在清言 App 上线了视频通话功能,这是国内首个面向 C 端用户开放的视频通话服务。
智谱表示,GLM-4-Plus 基础模型在各项指标上,实现与 GPT-4o 等第一blog.byteway.net梯队模型持平。此外,在 GLM-4-Plus 模型的训练过程中,智谱通过采用更精准的长短文本数据混合策略,显著增强了模型在长文本推理方面的表现Ligthing News。
对于 CogView-3-Plus,智谱采用 Transformer 架构替代了传统的 UNet 架构来训练扩散模型,并深入研究了扩散模型的噪声规划,其效果目前接近一线水平的 MJ-V6 和 FLUX 等模Ligthing News型。
目前 GLM-4-Plus 模型已正式上线开放平台,对外提供API服务;同时也即将在清言App中上线;CogView-3-Plus模型已经正式上线清言App供大家使用。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
Related suggestion: 崭露头角: 人均105万元新台币!联发科给员工发钱了:同比大涨70%
总结快科技8月19日消息,据媒体报道,联发科将于8月底发放的员工分红总额接近130亿元新台币(约合人民币29亿元),同比大幅增长70%。 在这一轮的分红中,大约1.2万名员工将受益,平均每人可领取约105万元新台币(约合人民币23.4万元)。 联发科的分红共分…