来源:昆明发布
8月28日,由国家数据局主办的2025中国国际大数据产业博览会高质量数据集主题交流活动在贵阳市召开,期间,国家数据局正式发布首批高质量数据集典型案例名单,部署高质量数据集建设先行先试任务。云南广播电视台“云南南亚东南亚文化旅游视听高质量数据集建设”项目入选名单。该项目作为全国首批文化旅游领域高质量数据集建设项目之一,将建设覆盖文字、图片、视频、声音的多模态高质量数据集。
据介绍,数据在推动人工智能+的过程中发挥着关键的作用,高质量数据集更是人工智能发展的根基。云南广播电视台“云南南亚东南亚文化旅游视听高质量数据集建设”项目主要对云南省丰富的生物多样性、少数民族文化、自然文化遗产进行系统性的数字化保存和保护。该项目通过高清、超高清乃至未来更先进的影像技术记录相关内容,并构建成结构化、可解析的数据集,为这些宝贵的资源建立“数字基因库”,使其得到永续留存和研究利用,同时,经过系统梳理和标注的数据集,将有助于进一步地推动人工智能大模型训练、AIGC创作,推动相关产业的融合发展。
目前,云南广播电视台已累计存储相关视频超过20万小时、音频超过10万小时,为数据集建设提供了坚实基础,初步构建了民族服饰、地标建筑、珍稀动植物、主持人语音四大特色数据集,已形成16万条高质量可标注数据,为多模态模型训练微调和AIGC内容生成提供关键支撑。目前,该项目已训练微调产出了40多个模型,涵盖民族服饰、珍稀动物、地标建筑等,已助力50余部AIGC作品创作,总阅读量超6000万,其中,AI短片《宝宝象的奇幻北征》获国家广电总局“创意视界·可灵AI创作活动”创意星河主题奖,《AI云南·端午安康》英文版登上新华社海外版。
本次被国家数据局列为行业高质量数据集试点项目,是云南广播电视台抢占数字经济高质量发展、数据要素价值化先机的重要机遇。下一步,项目将围绕“技术融合、场景支撑、标准验证、机制建设”四个方面开展建设,进一步夯实数据要素底座,以高质量、多模态、结构化数据供给,支撑内容生产、模型训练与产业应用,试点完善数据采集、治理标注平台建设与共享机制,联合文旅机构、地方融媒、院校和企业等协同共建,推动媒体高质量发展,赋能数字文旅,增强国际传播能力,为云南广播电视台媒体融合发展提供高质量可持续发展提供坚实支撑。
来源:云南广播电视台
编辑:李青芸
一审:李娟娟
二审:位伟锋
三审:朱朝辉
注: 版权归原作者所有,如有侵权,请联系我们删除
·END·
云南新闻广播
广播直播 节目回听尽在掌握
还没有评论,来说两句吧...