智谱 AI 开源 CogVideoX 视频生成模型:单张 4090 显卡即可推理
IT之家8月6日消息,智谱AI今日宣布,将与“清影”同源的视频生成模型——CogVideoX开源。据介绍,CogVideoX开源模型包含多个不同尺寸大小的模型,目前将开源CogVideoX-2B,它在FP-16精度下的推理需18GB显存,微调则需要40GB显存,这意味着单张4090显卡即可进行推理,而单张A6
腾讯混元 DiT 文生图大模型开源 6G 小显存版,一同开源打标模型
IT之家7月4日消息,腾讯混元文生图大模型(混元DiT)今日宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者比较友好。此外,腾讯宣布混元文生图打标模型“混元Captioner”正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发
新型 AI 算法亮相:功率降至常规配置 1/50,显存占用降至 1/10
IT之家6月27日消息,美国加州大学圣克鲁兹分校的研究团队研究出新的方法,只需要13W的功率(相当于一个现代LED灯泡的功率),就能运行10亿参数规模的大语言模型。而作为对比,用于大语言模型任务的数据中心级GPU需要约700W。AI浪潮下很多公司、机构的研究主方向
最火AI角色扮演流量已达谷歌搜索20%!每秒处理2万推理请求
梦晨发自凹非寺量子位|公众号QbitAI什么AI应用每秒处理20000个AI推理请求,达到2024年谷歌搜索流量的1/5?答案是独角兽Character.ai,由Transformer作者NoamShazeer(后面简称沙哥)创办。刚刚,沙哥公布了推理优化独门秘诀,迅速引起业界热议。具体来说Character.ai在
8GB显存,华擎推出RX 6500 XT变体版显卡
近日,华擎推出了一款RX6500XT变体版显卡,型号为:华擎AMDRadeonRX6500XTPhantomGaming8GBOC。它搭配的是8GB容量、64bit位宽的GDDR6显存。对于RX6500XT显卡,AMD官方的原始设计是搭配4GB显存。而华擎这款显卡,它足足搭配了8GB显存,因此笔者称它为变体版显卡。
RTX 50五大核心集体偷跑:居然有两个缩水了
快科技6月12日消息,红绿蓝三家的下一代显卡大概率都要等到年底,其中关注度最高的当然是BlackwellRTX50系列,现在网上出现了新一代五大GPU核心的配置情况,包括SM单元数量、显存位宽与颗粒。顶级大核心编号GB202,将配备12组GPC,每一组GPC内分为8组TPC,而每组TPC又分为2