文章
当前位置: 主页 > 资讯 > 文章
传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大新团队丨GC大事日报
发布日期:2023-08-04 阅读次数:

  21、淘宝AIGC装修工具“真能造”将上线、AMD计划年底推出AI芯片,看好中国AI机遇

  27、长虹:已公测AI系统款电视 或嵌入对线、韩国研究者发布音乐字幕数据集LP-MusicCaps

  据Business Insider今日报道,亚马逊CEO安迪贾西(Andy Jassy)发布一封内部电子邮件,任命Alexa高级副总裁兼首席科学家罗希特普拉萨德(Rohit Prasad)作为他的直接下属,负责领导一个新成立的“中心团队”,将集中资源来构建亚马逊最广泛的大型语言模型。贾西将其称作亚马逊“最雄心勃勃”的大型语言模型。

  据英国《金融时报》8月1日援引知情人士消息,Meta准备最早于9月推出一系列能表现出不同个性的AI聊天机器人,目的是为用户提供新的搜索功能及推荐,以及成为人们娱乐的有趣产品。Meta一直在设计能像人类一样与用户交谈的聊天机器人原型产品,试图以此提升其社交媒体平台的互动率。目前它正在设计的一款能像Abraham Lincoln一样与用户交流的机器人,另外一款则能以冲浪运动员的口吻提供旅行建议。

  据华为常务董事余承东今日发布微博,华为手机的小艺语音助手已升级支持大型语言模型,可撰写微博文案。随附的视频显示,语音输入要求后,小艺即可快速生成微博文案,其生成内容下方有一行小字:“由AI模型自动生成,可能存在疏漏,仅供参考”。

  今日,阿里云通义听悟上线了三大新功能,包括国内音视频AI领域首创的视频自动提取PPT,以及浏览器插件、钉钉和微信小程序,帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容。今年6月,阿里云首次宣布聚焦音视频内容的AI新品通义听悟开放公测。

  在通义听悟本次更新的功能中,“自动提取PPT”功能引入视觉AI算法,支持自动将PPT讲解视频分割为演示文稿,并对每页PPT进行要点总结,形成一份图文并茂的大纲,解决培训、网课学习等场景“求PPT难”的问题。“浏览器插件”功能支持用户开会、上网课、看直播、看视频时,可用Chrome和Edge浏览器插件全程录制,并实时生成双语字幕。“移动端支持”方面,通义听悟钉钉和微信小程序不仅支持PC端的基础功能,还可以一键转写手机和聊天记录的音视频文件。

  根据阿里云官方公众号,日前,国际数据公司(IDC)发布2022年中国AI公有云服务市场份额报告,阿里云语言AI市场份额连续四年排名第一。语言AI服务由对话式AI、智能语音、自然语言处理(NLP)三大细分市场构成,根据报告,阿里云在这三大细分市场的市占率分别为第一、第一、第二。

  今日,百度智能云“千帆大模型平台”升级了三大功能。百度智能云AI与大数据平台总经理忻舟表示,目前,千帆大模型平台已经全面接入Llama 2全系列、ChatGLM2、RWKV、MPT等33个大模型,成为国内拥有大模型最多的平台。接入的模型经过千帆平台二次性能增强,模型推理成本可降低50%。同时,千帆平台上线了国内最全的预置Prompt模板,模板数量多达103个,覆盖对话、游戏、编程、写作十余个场景。第三,千帆是国内首家提供插件服务的大模型平台,本次升级再次发布多款全新插件。

  8月2日,百度Apollo宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴。百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践,完成多项创新功能在量产车型平台上的验证,部分功能未来有望在长城、领克、smart等量产车型上率先落地。

  据站长之家报道,韩国人工智能创业公司Upstage的最新人工智能模型Upstage在一项全球认可的开源语言模型评估中超过了OpenAI的ChatGPT。Upstage采用 Meta最新开源的Llama 2 70B模型训练,在最新的HuggingFace Open LLM Leaderboard排行榜上获得了平均得分72.3。该排行榜有超过500个LLM(大语言模型)参与竞争,据称这是非主流AI模型首次在排行榜上超过搭载GPT-3.5的 ChatGPT。

  根据荷兰内梅亨大学近日发布的研究报告,Meta和OpenAI等公司在使用“开源”术语时容易误导用户,部分标记为“开源”的大语言模型实际上并非开源的,比如Meta公司的Llama 2模型的大语言模型的代码并未向公众开放,透明度只是稍微优于ChatGPT模型。研究人员表示,当前AI社区中,缺乏开源大语言模型问题日益突显。

  据IT之家消息,OpenAI在去年4月推出了第二代DALL-E“文生图”模型,一度出圈。近日,OpenAI日前正在准备下一代 DALL-E AI 模型(DALL-E 3),已经在进行一系列Alpha测试,Discord上的一位匿名用户日前分享了他在测DALL-E 3时的体验。该匿名用户表示,5月份的DALLE 3测试版本已经能够生成多种长宽比的图像,同时支持更长的提示语句,还能生成“正常的文字”。

  7月31日,GLM技术团队发布专门针对模型长文本理解能力的评测数据集LongBench。该数据集包含了13个英文任务、5个中文任务和2个代码任务。多数任务的平均长度在5k-15k之间,共包含约4500条测试数据。LongBench包含单文档QA、多文档QA、摘要、Few-shot学习、代码补全和合成任务等六大类任务20个不同子任务。

  科大讯飞8月1日在互动平台表示,科大讯飞于2009年开始算力基础设施建设,在总部自建有业界一流的数据中心,目前已建成4城7中心深度学习计算平台。科大讯飞的算力不仅完全满足AI算法模型训练,还面向开放平台数百万开发者和其他行业伙伴提供相关AI服务的需求,今年年初以来与领先国产AI算力厂商进一步加大合作投入并取得重要成果,让自主可控的星火大模型在自主可控的算力平台上持续进化提升。8月15日,星火大模型重大版本升级将升级代码能力、开放多模态能力、知识问答等方面能力还会持续迭代提升。

  科大讯飞8月1日在互动平台回应苹果应用商店下架星火大模型APP提问时表示,讯飞星火APP正在升级优化,华为应用商店的讯飞星火APP新版本已于8月1日升级完毕,用户可前往应用商城下载或升级体验。苹果商店尚在更新中。此外讯飞星火认知大模型V2.0升级发布会将于8月15日举办,届时会发布多模态生成、代码生成能力及行业产品等多项能力及应用。

  长城汽车今日宣布成为百度文心大模型首批智能座舱应用探索伙伴。长城汽车与百度Apollo将围绕车载交互场景开展深入探索和实践,携手打造基于智能汽车场景的大模型人工智能交互。目前,长城汽车已在大模型全链路语音赋能和第三空间生成等方面取得了重大成果,多项创新功能已率先在量产车型平台完成验证,陆续大规模应用。

  据彭博社8月1日报道,Uber正在开发一款由AI驱动的聊天机器人,以集成到其应用程序中,加入众多使用该语言工具来改善客户服务、营销和其他自动化任务的公司行列。

  Uber CEO达拉科斯罗萨西(Dara Khosrowshahi)周二在接受彭博科技节目采访时强调了Uber目前在其业务中使用AI的方式,但没有提供有关聊天机器人能够做什么的具体细节。

  潞晨科技微信公众号今日发文称,近日,况客科技与潞晨科技达成战略合作,携手探索基金投研大模型应用的新空间,志在为国内机构提供自主可控、可私有化部署的投研大模型应用解决方案。合作目标是让金融机构客户在充分保证数据安全与隐私可控的基础上,真正拥有大模型应用的自主权和可交付性,以及动态更新优化模型的能力。

  况客科技专注于基金研究领域,旗下已开发出面向金融市场的基金相关衍生数据库、FOF Pro基金投研SAAS系统等产品。况客科技最近上线了基于大语言模型的基金投研AI模块FOF Pro Copilots,使得基金研究的门槛大幅降低。潞晨科技旗下的Colossal-AI是一个通用的高效训练和部署的深度学习系统,以高性能、低损耗、低成本等特点著称,为大模型私有化部署提供降本增效的方案。两家企业将为金融机构客户提供一揽子的大模型应用部署服务,确保基金投研大模型应用真正实现自主可控和可交付。

  据外媒Evening Standard报道,谷歌近日拟在英国提供免费的人工智能培训课程,目前已有两期课程开放注册,另有八个模块即将推出。据悉,这两个模块将于8月中旬至10月初在YouTube上进行直播,期间参与者将有机会提问。在45分钟的时间里,用户将学会如何使用人工智能工具来节省时间,包括如何减少行政任务、集思广益和编写代码。课程还包括在工作场所应用不同系统的方法、何时以及如何投资人工智能,以及如何为机器学习项目准备数据。

  据IT之家报道,谷歌近日从Play Store和苹果App Store下架了AI Test Kitchen应用。该应用主要测试谷歌的各种AI系统,用户可以在其中了解、体验新兴AI技术并提交反馈。AI Test Kitchen 于去年5月召开的I/O大会上亮相,于去年8月上架谷歌Play Store和苹果 App Store平台。

  据The Verge今日报道,根据7月31日谷歌YouTube支持页面的通知,谷歌开始在YouTube上测试使用AI自动生成YouTube视频概要。这些概要将出现在YouTube的观看和搜索页面上,只会出现在有限数量的英语视频旁边,并且只能由有限数量的用户观看,旨在简要概述视频内容,不会取代人写的现有描述。

  谷歌发言人Jen Jamie告诉The Verge: “我们正在为观众测试一项新功能,用生成式AI为YouTube视频创建摘要。我们经常在新功能正式推出之前对其进行测试,以便我们能够为观众和创作者构建和完善最佳体验。” Jamie称,YouTube观看者在移动设备上观看英语视频博客、购物和操作视频时可能会看到自动生成的摘要。YouTube的实验是谷歌正在进行的一系列生成式AI计划之一。

  据站长之家援引情人士消息,淘宝于7月下旬内测的AI装修功能“线日的家装家居生态峰会上正式对外发布。该产品可以免费为用户生成10种不同风格的装修设计图。用户只需上传空间照片后选择偏好的设计风格,就能在20秒内免费获得相应的装修设计图。

  在周二举行的AMD财报电话会议上,AMD CEO苏姿丰谈道,虽然我们仍处于AI新时代的早期阶段,但很明显AI为AMD带来了跨越云、边缘和日益多样化的智能端点的数十亿美元的增长机会。仅在数据中心方面,AMD预计到2027年,AI加速器市场将达到1500亿美元以上。AMD增加了AI相关的研发、生态系统支持和上市投资,以在这个新兴市场中占据重要份额。

  据路透社今日报道,在周二举行的AMD财报电话会议上,AMD CEO苏姿丰谈道,AMD拥有足够的MI300芯片组件,将在第四季度积极推出和提高其旗舰MI300 AI芯片的产量,并承诺在2024年供应充足。MI300系列芯片预计2024年上半年会进行早期部署,将与英伟达已经销售的H100 GPU芯片竞争。

  苏姿丰说,客户对MI300和MI300X GPU芯片的兴趣非常高,AMD本季度与顶级云提供商、大型企业和众多领先AI公司的合作显著扩大。AMD尚未给出详细的全年预测,但表示预计2023年包括MI300芯片在内的数据中心业务销售额将超过2022年的60.4亿美元。随着多家客户启动或扩展支持Instinct MI250和MI300硬件和软件未来大规模部署的计划,AMD第二季度AI集群业务连续增长了7倍以上。“我们的计划是完全遵守美国的出口管制。但我们确实相信,有机会为正在寻找AI解决方案的中国客户群开发产品,我们将继续努力朝那个方向。”苏姿丰说,中国对AMD来说是一个非常重要的市场。

  国家发展改革委等部门今日发布《关于实施促进民营经济发展近期若干举措》的通知,提出支持民营企业参与重大科技攻关,牵头承担工业软件、云计算、人工智能、工业互联网、基因和细胞医疗、新型储能等领域的攻关任务。

  今日,广州市发布《广州市促进民营经济发展壮大的若干措施》。广州市计划聚焦应用场景示范,鼓励民营企业积极参与人工智能应用场景建设。在智能制造、智慧城市、智慧交通、智慧教育、智慧医疗等多个领域加大应用场景开放力度,支持民营企业参与应用场景设计与建设,促进人工智能与其他产业链的融合和赋能。依托行业专业机构牵头组织人工智能企业产业场景应用对接,加快产品产业转化。

  7月27日,杭州市发布了《关于加快推进人工智能产业创新发展的实施意见》(简称《意见》)。《意见》提出,鼓励头部企业、高校院所开展多模态通用大模型研发并向中小企业开放模型应用,对参数量超过千亿,经权威第三方评测机构评测性能达到国内领先的通用大模型,给予牵头研发单位训练成本补助,补助金额最高不超过5000万元。支持企业、高校院所围绕擅长领域开发专用模型,每年评选不超过10个性能先进并在杭成功落地的优秀专用模型,按照不超过研发成本30%的标准给予牵头研发单位补助,补助金额最高不超过500万元。

  根据四川长虹官方投资者关系平台,8月1日有投资者在平台上提出“想买个更高级的聊天机器人电视机”的需求。对此, 四川长虹董秘回复道:“目前,部分长虹电视产品已经搭载‘长虹超脑’人工智能系统,以期为用户带来更好的产品使用体验,目前正在面向用户正式公测。”

  来自韩国科学技术院等机构的研究人员7月31日在预印本平台arXiv上发表一篇论文,公布了一项名为基于大型语言模型的音乐字幕数据集LP-MusicCaps。为了解决现有音乐语言数据稀缺问题,研究人员建议使用大型语言模型从大规模标注数据集中人工生成描述句子,这会产生大约220万个字幕和50万个音频剪辑。研究团队使用自然语言处理和人类评估领域使用的各种定量评估指标对大规模音乐字幕数据集进行系统评估,使用数据集训练了基于Transformer的音乐字幕模型,并在零样本和迁移学习设置下对其进行了评估。结果表明,其提出的方法优于监督基线模型。

  根据汤姆猫8月1日发布的投资者关系活动记录表,汤姆猫海外研发团队在前期接入GPT-3.5、GPT-4等预训练语言模型的基础上,结合Embeddings等技术服务,测试了GPT与预设数据库相结合的创新模式,旨在提升用户智能聊天体验的同时降低成本。同时其海外团队也在测试谷歌的Bard模型,持续优化、丰富产品的交互体验。

  云天励飞8月1日发布投资者关系活动记录表,提到大模型应用的爆发将会带来AI推理计算需求激增,云天励飞在AI推理芯片上积累了多年的技术能力,2022年流片的Edge10针对Transformer的计算需求进行过优化,Edge10适用于AI推理的场景,如机器人、AI边缘计算盒子、服务器等,目前在初步商用阶段。

  据央广网报道,近日,由南京大经中医药信息技术有限公司(简称:大经中医)研发的“岐黄问道大模型”在南京发布。大经中医在现场对三款中医大模型进行了演示:已确诊疾病的临床诊疗大模型,可以根据用户提供的疾病、症状、体征信息给出辨证诊断结果和中药处方治疗方案;症状、体征的临床诊疗大模型,可以根据用户提供的主诉症状和伴随症状、体征信息,给出辨证(诊断)结果和治疗方案(中药处方);中医养生调理大模型,可以根据用户提供的症状、体征信息,给出个性化中医健康状态辨识结果,以及食疗、茶饮、推拿、艾灸等多维度养生方案。

  据36氪报道,近日,南京AI安全创企众智维科技完成近亿元A轮融资,由奇安投资领投,苏州相城金控、海邦投资跟投,航行资本担任独家财务顾问。众智维科技成立于2015年,依托AI赋能网络安全领域,围绕AISecOps(AI安全运营)打造了一系列的新型平台化网络安全产品和解决方案。 据众智维科技创始人兼董事长孙捷介绍,众智维科技目前已与清华大学、南京大学、百度合作,在文心一言、ChatGLM生成式大模型的基础上自研了众智维科技安全大模型“红色卫士RedGuard”。

  国芯科技今日在互动平台回复投资者问题时表示,边缘计算芯片和AI芯片是公司重点布局的方向,公司在边缘计算芯片方面已开展了二代芯片的研发和产业化应用。国芯科技在AI芯片的布局包括:(1)在云AI芯片方面,围绕AI服务器应用,开发系列化芯片产品,目前已有芯片产品包括Raid控制芯片和超高速加解密处理芯片,未来将继续开展AI服务器芯片组的开发和应用;(2)在端AI芯片方面,已在生物特征设别领域推出了包括轻量级AI(卷积协处理器)和安全处理的SoC芯片,实现指纹和人脸识别应用,未来将在现有基础上继续发展生物特征识别领域的高性能端AI芯片;(3)正在开发RISC-V CPU内核系列,目前正在开展将AI引擎加入到RISC-V CPU内核中,形成具有AI引擎的CPU内核系列;(4)正在为客户AI芯片提供定制服务,目前已有多个AI芯片定制服务的在手订单;(5)将继续和合作伙伴合作,联合开展GPU和NPU等技术的研发和应用。

  据IT之家报道,美国众筹平台Kickstarter近日宣布,将规范平台中涉及AI的相关项目,Kickstarter要求这些项目披露“与AI相关的更多技术细节”,才能够上架平台发起众筹。Kickstarter要求涉及AI的相关项目必须披露“为什么要使用AI工具”、“哪些方面使用AI工具”、“所用AI工具的具体信息及相应实例”,同时要求项目所有者公开“训练数据相关的授权信息”。

  财联社8月1日电,由澳门科技大学领导的一个国际合作小组开发出一种创新的人工智能预测模型——“UniBind”,能够预测新冠病毒中的哪些突变株将对人类构成重大威胁。这项研究发表在最新一期的《自然医学》杂志上,有助改变人类分析新冠疫情以及其他潜在传染病的模式和能力。