近日,在位于海口数字科技创新平台的百度智能云(海口)人工智能基础数据产业基地,上千名大模型数据标注师正分组开展数据采集和标注业务,为人工智能“焕新”升级提供数据支持。
今年5月,国家数据局公布首批7家全国数据标注基地试点名单,海口成为海南唯一入选城市。记者从市科工信局获悉,海口计划在2年试点建设期内,围绕技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等6个方面推动国家数据标注基地试点建设,重点打造以AI数据国际化和卫星遥感测绘为特色的数据标注示范基地。
产业人才双向奔赴
数据是人工智能的“燃料”,而数据标注则是AI训练师的重要工作之一。
百度智能云(海口)人工智能基础数据产业基地作为百度在全国的首个大模型数据标注基地,自去年4月运营以来,已吸引超过10家生态合作企业入驻,数据标注从业规模达1000余人。
“我在大学期间就非常向往人工智能应用,毕业后终于在海口圆了AI梦。”“00后”数据标注员陈泽哲告诉记者,他的工作主要是结合用户提出的问题,给大模型生成的文本进行打分,从而提高大模型的“智商”,使其回复内容更加准确、精简、有逻辑。经过半年多的培训实操,他已从一名“门外汉”成长为能够独当一面的小组长。
数据标注产业的蓬勃发展离不开产业人才的支撑与推动。记者了解到,2年试点建设期内,海口计划采用“政府引导、企业为主体、市场化运作”的运营模式扩大产业规模,预计引进数据标注企业不少于30家,其中龙头企业不少于5家,培育本地数据标注企业不少于20家。
为此,海口将协助基地企业与省内高校探索设立数据标注相关选修课程、开设订单班、送岗实习等校企合作机制,加强数据标注专业型人才供给,预计带动数据标注从业人员不少于1万人,每年培养数据标注人才不少于2000人,引进本科以上高水平标注人才不少于1000人。
“解锁”更多应用场景
“小到人脸支付、大到智慧城市,可以说每个居民都是人工智能、数据标注的用户群体。”在百度智能云(海口)人工智能基础数据产业基地办公大厅,入驻服务商百度智能云海南拓明云海科技有限公司项目现场负责人何国津告诉记者,目前基地基于大模型标注主导的多个项目已陆续投用,并为海口智慧城市建设持续提供有力支持。
根据海口市国家数据标注基地试点建设任务书,海口将以AI数据产品化为亮点,形成一批行业高质量数据集,打造基于跨境贸易、航天大数据、自动驾驶、大模型为主要创新场景的数据标注基地。
“公司成立6年来已获得授权10项发明专利,33项软件著作权。”海南长光卫星信息技术有限公司总经理朱济帅介绍,当前公司正在开展航天航空数据标注业务,并同步推进标注基地建设。基地位于海口膜力创新工场5层,项目分两期建设,一期即将投入使用,二期预计2025年动工。
市科工信局相关负责人表示,下一步海口将持续完善数字经济发展支持政策,开展相关产业链招商,大力招引生态合作企业,促进人工智能数据标注产业上下游产业链集聚发展,打造数据驱动、生态共融的国家级数智经济产业集群。