海口百度全国首个大模型数据标注基地,就业规模超千人
聚焦“AI数据国际化”和“卫星遥感测绘”
海口推动国家数据标注基地试点建设
海南日报海口7月15日讯(海南日报全媒体记者郭萃)海南日报全媒体记者近日从海口市科工信局获悉,海口将推动国家数据标注基地试点建设,重点打造以“AI数据国际化”和“卫星遥感测绘”为特色的数据标注示范基地。在2年试点建设期内,海口将充分发挥区位优势,提供“来数加工”等增值服务,形成国际化数据服务能力,培育和参与国际化的数据要素市场。
今年5月,国家数据局公布首批7家全国数据标注试点基地名单,海口成为我省唯一入选城市。何为数据标注?海口市科工信局相关负责人介绍,数据标注是指通过加工处理,将图片、文本、语音、视频等原始数据转变为机器可识别信息的过程。数据标注是人工智能算法运行的关键环节,在推动数据资源汇聚、提升数据质量、盘活数据要素价值中起重要作用。
当前,海口市开展数据标注基地试点建设工作主要依托百度智能云(海口)人工智能基础数据产业基地。此外,海南长光卫星信息技术有限公司(以下简称长光卫星)也正在开展航天航空数据标注业务。
7月15日上午,在位于秀英区招商局大厦的海口数字科技创新平台的百度智能云(海口)人工智能基础数据产业基地,一台台计算机前,人工智能(AI)数据标注师正通过数据标注平台,熟练地判断、标记大模型生成的内容数据,推进来自全国客户的AI数据标注项目。该基地总建设面积1.14万平方米,是百度在全国的首个大模型数据标注基地,自2023年4月运营以来,已吸引超过10家生态合作企业入驻,数据标注从业规模达1000余人。
长光卫星也正在推进标注基地建设,该基地位于海口膜力创新工场5层,项目分两期建设,一期面积2447平方米,即将投入使用;二期预计2025年开始动工,2026年完成后将形成总面积5000平方米的产业基地,构建高质量的数据标注基地。
按照计划,在2年试点建设期内,海口市将围绕技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等6个方面建设数据标注基地,在技术创新方面,聚焦数据采集、清洗、标注、合成、检测等数据治理环节,攻关一系列相关智能化、自动化数据标注技术,研发一体化智能标注平台;同时,围绕跨境贸易、金融、农业、文化旅游、教育、遥感测绘地理等6个行业数据,完成标注数据量总规模不少于1000TB,引进5家数据标注龙头企业,培育和引进50家标注企业,带动上万人数据标注从业人员就业,直接拉动数据标注产业规模达10亿元。
据悉,下一步,海口将借鉴全国数据标注产业发达地区的相关政策,围绕场地租金补贴、生产要素扶持、人才培育和引进补贴等,计划于今年9月底前出台海口市数据标注产业发展的扶持政策;并依托百度基地“文心一言”大语言模型和长光卫星的龙头企业优势,开展产业链招商,大力招引生态合作企业,促进人工智能数据标注产业上下游产业链发展,打造数据驱动、智能使然、生态共融的国家级数智经济产业集群。
来源:海南日报