“紫东太初”首次实现“以图生音”和“以音生图”
近日,在上海举办的2022世界人工智能大会上,由武汉人工智能研究院、中国科学院自动化研究所和华为技术有限公司联合研发的“紫东太初”多模态大模型项目获得了大会最高奖项“卓越人工智能引领者”(SAIL,Superior AI Leader)奖。
据悉,紫东太初,是全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer),同时具备跨模态理解与跨模态生成能力,取得了预训练模型突破性进展。
“紫东太初”兼具跨模态理解和生成能力。与单模态和图文两模态相比,其采用一个大模型就可以灵活支撑图-文-音全场景AI应用,具有了在无监督情况下多任务联合学习、并快速迁移到不同领域数据的强大能力。引入语音模态后的多模态预训练模型,可实现共性图文音语义空间表征和利用,并突破性地直接实现三模态的统一表示。特别地首次使 “以图生音”和“以音生图”成为现实,对更广泛、更多样的下游任务提供模型基础支撑,达成AI在如视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。
如今我国人工智能发展成效显著,人工智能创新水平已经进入世界第一梯队,与美国的差距正在缩小,那么我国人工智能行业未来发展前景如何呢?
据中研产业研究院发布的《2022-2027年人工智能企业薪酬现状分析与未来发展趋势预测报告》分析
在科技迅速发展的时代,人工智能的发展是大势所趋,而中国发展人工智能具有着良好的社会环境,如在人才培养、人力资源、社会消费需求等方面体现出游刃有余的社会优势。
中研普华推测,2025年人工智能核心产业规模将超过4500亿,到了2030年这一数据将飞速发展,产业规模有望超过一万亿。在产业政策支持下,市场立法逐渐健全,未来中国人工智能市场规模将高速增长,到2025年将突破3000亿元。作为全球最大的人工智能应用市场,中国人工智能技术落地迅速,已经广泛应用于多个行业和场景。中国人工智能飞速发展刺激着各行各业的经济,应用市场潜力巨大。
人工智能技术与物联网、大数据、云计算、区块链等技术相比,人工智能技术服务面更广、影响力更大。随着全球主要国家将人工智能列为战略性技术和国家之间竞争的核心关键产业领域,人工智能产业发展迎来良好的历史机遇。随着人工智能产品和应用领域的不断成熟,未来5-10年全球人工智能产业规模处于快速发展期。
在中国互联网普及之后,随着通信技术的发展,移动互联网开始出现。此后,智能手机也迎来了爆发期。现阶段,智能手机的发展仍呈现爆发式的趋势,但这种爆发式不同于移动互联网时代。在人工智能时代,智能手机的爆发更多体现在品质上。
随着全球主要国家将人工智能列为战略性技术和国家之间竞争的核心关键产业领域,人工智能产业发展迎来良好的历史机遇。
欲了解更多关于我国新能源汽车行业未来发展趋势的详细分析,可查看中研普华撰写的《2022-2027年中国新能源汽车行业市场全面分析及发展趋势调研报告》。
关注公众号
免费获取更多报告节选
免费咨询行业专家
2022-2026年中国人工智能行业全景调研与发展战略研究咨询报告
产业介绍人工智能覆盖的产业相对较广,主要包括基础层、技术层和应用层,涵盖多个不同的技术及应用场景。当前中国人工智能领域产业格局尚未成熟,上中下游具有较大的发展空间。目前,人工智能行...
查看详情
中国进出口银行:今年前8个月累计投放外贸产业贷款1.25万亿元据央视新闻,今天(9月20日)从中国进出口银行了解到,今...
据中国新闻周刊去年报道,时至今日,全国槟榔消费者超1亿人,主要分布在湖南、云南、广西、海南、台湾等南方地区。相1...
油价又要变了,本轮油价预测要下降!9月21日24时,国家发改委将开启新一轮国内成品油调价窗口。据卓创资讯测算,截至9...
报告显示:近十年我国GDP年均增长6.6% 对世界经济增长平均贡献率超30%国家统计局日前发布的党的十八大以来经济社会...
9月19日,商务部公布的数据显示,2022年1-8月,全国实际使用外资金额8927.4亿元人民币,按可比口径同比增长16.4%(下...
光伏玻璃产量及产能工信部数据显示,1-8月,全国光伏压延玻璃新增在产产能同比增长55.1%,截至8月底,国内光伏压延玻...