“橘洲”站上全球风口!汇视威今日发布国内首个基于国产算力预训练的视觉基座大模型
长沙晚报5月20日讯(全媒体记者 洪孟春 邬伟 吴鑫矾)少年心事当拏云。21日,“橘洲”V1端侧版在长沙上线!这是国内首个基于国产算力预训练的视觉基座大模型,能在智能手机上实现1024×1024分辨率图像的秒级生成,具有成本低、质量高、速度快、轻量级、可离线的特点。特别值得一提的是,该模型的研发团队成员平均年龄不到30岁,部分还是在读博士。
继大语言模型之后,视觉大模型将是全球人工智能的下一个风口。“橘洲”视觉基座大模型由湖南汇视威智能科技有限公司(简称“汇视威”)自主研发,依托中科曙光算力,在较短时间内完成了近4000万张图片训练,成为全国首个在国产算力上完成整体训练和推理过程,并实现移动端部署的视觉基座大模型。
视觉大模型是视觉人工智能的基础设施。由于其参数多、模型大、算力需求强,其推理过程需在服务器端实现,因此有着推理成本高、数据隐私缺少保障、带宽和时延要求严苛等弊端。
“橘洲”视觉基座大模型创新性地解决了这些痛点。其采取跨模型结构极限蒸馏技术,图片解码模型参数量是云端解码模型参数量的1/50;设计了高效的文生图预训练方法,将训练时间压缩到20小时;使用加速推理训练方法,出图从28步压缩至4步,能做到秒级生成高分辨率图片。
“用智能手机自带的芯片就能运行,极大降低了算力成本,即使处于飞行模式也能正常操作,这是‘橘洲’视觉基座大模型最大的特点之一。我们期待与更多的企业合作共建行业生态,赋能千行百业,为中国人工智能参与全球竞争贡献力量!”汇视威创始人顾善植表示。
“人工智能是年轻的事业,也是年轻人的事业。”今年“五四”前夕,习近平总书记在上海“模速空间”大模型创新生态社区为年轻人鼓劲加油。而在“橘洲”视觉基座大模型背后,也有着长沙青年“心忧天下,敢为人先”的奋斗实践。
“95后”顾善植目前正在国防科大攻读计算机科学与技术专业博士学位。2021年,顾善植在长沙创业,11名“90后”创始人全都是来自清华大学、国防科大等国内知名高校的博导、博士、硕士。大家从天南海北相聚于此,与长沙双向奔赴、共同成长。
“长沙为科技创新和企业发展提供了有力支撑,是青年人的创业沃土。”顾善植说,不论是以前、现在还是今后,长沙都是他和企业最好的选择。
>>我要举报