大模型资讯:

华为云盘古大模型正式发布:重塑千行百业

华为云开发者大会2023上,华为常务董事、华为云CEO张平安宣布盘古大模型正式发布。


【资料图】

张平安表示,盘古大模型是一个完全面向行业的大模型 ,包括NLP大模型,多模态大模型,视觉大模型,预测大模型和科学计算大模型,针对政务、金融、制造、矿山等行业提供专用大模型,并可在各个垂直场景应用。

中国电信发布TeleChat大模型

世界人工智能大会期间,在中国电信“算网一体·融创未来”分论坛上,中国电信数字智能科技分公司正式对外发布中国电信大语言模型TeleChat,并展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。此外,以TeleChat为底座的教育版大模型TeleChat-E在全球大模型综合性考试评测榜单C-Eval上排名第七,前几名包括GP4、ChatGPT等知名大模型。

MidJourney 将迎来第六版,增加场景扩展功能。

在7月6日下午举行的2023世界人工智能大会产业发展论坛上,MidJourney创始人大卫·霍尔茨通过视频在大会上发表演讲。

霍尔茨表示,MidJourney 将会在即将发布的第六版中实现场景扩展功能,让图片展现出更丰富的内容。此外新版本还将加入新模式,将带来4-5倍的制图速度提升。

霍尔茨透露,自己最喜欢读科幻书和中国古典文学,MidJourney的名字就来自庄子的庄周梦蝶,对应其中的“中道”。

大模型生态合作共同体正式发起,云从科技、百度、阿里云等加入

在2023世界人工智能大会“聚焦·大模型时代AIGC新浪潮”论坛上,大模型生态合作共同体正式发起,云从科技、腾讯云、阿里云、百度、科大讯飞、清华大学、京东科技、九章云极等国内代表性大模型单位成为首批创始成员单位。

据了解,大模型生态合作共同体是按照国家新一代人工智能发展规划总体部署,为推动大模型研发、培育自主可控的产业生态而成立,旨在构建政府、产业、学术界和研究机构等各方共同参与的开放合作平台,助力中国人工智能大模型的研发和产业化进程,面向关键技术壁垒联合攻关,提升中国在人工智能领域的国际竞争力。

商汤日日新大模型体系全面升级

商汤科技今天在2023世界人工智能大会上召开“大爱无疆·日日新”人工智能论坛。

论坛中商汤公布商汤日日新SenseNova大模型体系的多方位全面升级,以及在该体系下的一系列大模型产品更新和落地成果。

据介绍,商汤商量SenseChat 版本突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可完美适配移动端、云端等不同终端及场景的应用需求,降低部署成本。商汤的自研生成式大模型商汤秒画SenseMirage 的模型参数从今年4月首次发布以来的10亿提升至70亿量级,能够实现专业摄影级的图片细节刻画。

大模型测试验证与协同创新中心正式成立

中国信通院官微消息,7月6日,2023世界人工智能大会在上海开幕。

开幕式上,中国信息通信研究院与上海人工智能实验室联合发起的大模型测试验证与协同创新中心正式成立。

该中心将围绕大模型能力测评、大模型系列标准、生态服务、模型治理和软硬件协同五方面开展工作,下设总体组、标准化与测评验证组、数据工作组、创新研发组、软硬件协同工作组、应用服务组共六个工作组。

奔驰正在测试 ChatGPT,帮助进行质量管理和流程优化等活动

据奔驰官方消息,奔驰目前已开始测试 ChatGPT,佳速其在 MO360 数字生产生态系统中的使用。

据悉,ChatGPT 将作为一个通用的、基于语音的界面支持生产员工,支持他们进行质量管理和流程优化等活动。

据悉,梅赛德斯-奔驰正在通过 Azure OpenAI 服务集成 ChatGPT,利用微软云和人工智能平台的企业级功能。

OpenAI 宣布向付费用户开放 GPT-4 API

OpenAI 今天宣布,即日起GPT-4 API 向所有付费 OpenAI API 客户开放。此外,OpenAI 还宣布部分版本将会在2024年退役。

OpenAI 表示,所有付费 OpenAI API 客户现在都可以访问具有 8K tokens 上下文的 GPT-4 API ,此外 OpenAI 计划在本月底前向新的开发人员开放访问权限,并根据计算资源开始调高速率限制。OpenAI 目前正在对 GPT-4 和 Turbo 进行微调功能测试,预计该功能会在今年晚些时候推出。

此外,OpenAI 宣布将会在6个月内淘汰一些使用Completions API 的旧模型。旧模型淘汰计划将会从2024年1月4日开始施行。

新加坡科技设计大学推出大语言模型 FLACUNA

新加坡科技设计大学近日推出一款大语言模型产品FLACUNA。

据研究团队表示,FLACUNA 基于VICUNA打造,通过在FLAN数据集上进行微调,提高了其问题解决能力。该数据集包括 FLAN 大型指令数据集和一些源自 ChatGPT/GPT-4 的代码相关数据和对话数据,涵盖了许多需要问题解决能力的任务。

AI热度降温又一迹象:散户6月加速涌入美股

据财联社报道,根据追踪美国散户交易流量的研究机构Vanda Research,今年6月,散户平均每天向美股投入14亿美元,接近3月份日均15亿美元的历史最高纪录。

Vanda Research高级副总裁Marco Iachini表示,一直以来深受散户喜爱的特斯拉汽车交付量创下历史新高,帮助激发了散户投资者对包括Rivian在内的其他电动汽车股票的兴趣。

相比之下,散户对包括在内的AI股的需求较今年早些时候有所放缓,此前这类股票曾连涨数周,不过最近有所回调。

阿里云通义大模型新成员通义万相正式上线

据界面新闻报道,阿里云通义大模型新成员通义万相今天正式上线,据了解,这是一个AI绘画创作模型。

阿里云智能集团首席技术官周靖人透露,通义千问已有累计超30的申请用户,超过100家深度共创企业,而通义听悟发布首月已有36万用户。

会上,阿里云还发布了ModelScopeGPT大小模型协同智能助手。

华为云CEO张平安:华为盘古大模型深耕政务、金融、制造、煤矿等行业

华为云开发者大会2023上,华为常务董事、华为云CEO张平安表示,华为盘古大模型“不做诗,只做事”,聚焦价值场景,深耕政务、金融、制造、煤矿等行业。张平安介绍,华为盘古大模型和山东能源集团云顶科技深度合作,已经开发了7个系统和21个场景化应用,并在全国8个矿井复制在使用,覆盖1000+个细分场景。

华为云昇腾AI云服务在乌兰察布和贵安上线

华为云2000P Flops单集群的昇腾AI云服务在乌兰察布和贵安同时上线。昇腾AI云服务可以提供更长稳的AI算力服务,千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。昇腾云服务除了支持华为的AI框架Mindspore外,还支持Pytorch,Tensorflow等主流AI框架,框架中的90%算子,都可以通过华为的迁移工具从GPU平滑迁移到昇腾。

重点论文:

基础模型的理解能力评估

研究团队通过一项实验评估了现有基础模型在视频理解方面的能力。他们进行了三项任务,包括动作识别、时间定位和时空定位,并采用八个受欢迎的数据集进行评估。针对这些任务,团队尝试了四种调整基础模型的方法。

研究发现:首先,专门针对任务设计的模型比我们研究的六个基础模型表现更好,这与在自然语言和图像理解领域的情况形成鲜明对比。其次,预训练数据中包含视频模态的原生模型通常在分类视频、定位动作以及理解多个动作方面优于只包含图像模态的模型。最后,在轻微调整下游任务(例如固定基础模型主干)的情况下,原生视频模型在视频任务上表现出色,而图像模型在进行全面微调时获得更好的结果。

论文地址:点此前往

推荐内容