
前两天我开车去一个朋友新开的餐馆,导航把我带进了一条死胡同。我盯着屏幕上的蓝色路线,明明显示前方畅通无阻,眼前却是一堵灰扑扑的围墙。倒车出来时,我忍不住骂了一句:“这地图数据也太不靠谱了。”后来才知道,那条路刚被市政封了三个月,地图公司还没来得及更新。这种事儿搁谁身上都窝火,但转念一想,我平时刷手机、点外卖、打车,哪样离得开地图数据?我们习惯了地图的精准,却很少去想那些藏在屏幕后面的数据是怎么来的。

地图数据标注,说白了就是给世界贴标签的活儿。你打开高德或百度地图,那些蓝色的道路、绿色的公园、红色的餐厅图标,都不是凭空出现的。它们是一群人在电脑前,对着卫星图,一笔一笔画出来的。我认识一个做数据标注的小伙子,他每天的工作就是盯着屏幕上密密麻麻的像素点,把一条条马路、一栋栋房子标注出来。他说最怕的是那种乡间小路,弯弯曲曲的,旁边还有树荫挡着,得放大到最大才能看清。有时候一天下来,眼睛酸得睁不开,但还得加班赶工,因为甲方催得紧。
这份工作听起来挺枯燥,却牵扯着巨大的产业链。地图数据标注是整个自动驾驶产业的底层基础。没有高精地图,自动驾驶的车子就跟瞎子没什么两样。特斯拉、百度Apollo、小马智行等公司砸进去几百亿搞自动驾驶,地图数据标注团队就是它们的“眼睛”。我采访过一位做高精地图的工程师,他说标注的精度要达到厘米级。比如一个红绿灯杆,不光要标出位置,还要标出倾斜角度和高度。因为自动驾驶的车辆要靠这些数据判断距离和速度,差一厘米,可能就会酿成事故。
但这事儿没那么简单。数据标注的人工成本正在快速上涨。最早的时候,地图公司还能靠外包团队在三四线城市招人,一个月两三千块钱就能搞定。现在不行了,标注员要会看卫星图、懂道路标识,还得有点几何知识,工资自然跟着涨。而且这活儿流动性特别大,很多人干两个月就跑了,嫌太累太枯燥。我认识的那个小伙子说,他们团队二十个人,半年换了三茬。公司不得不研发自动化工具,用算法先自动识别一遍,再让人工修正。可算法也会犯傻,比如把一片湖当成停车场,或把高架桥的匝道标成普通路口。
更麻烦的是数据合规问题。地图数据不是随便可以标的,国家测绘部门管得很严,尤其是涉及军事设施、政府机关、机场等敏感区域。我有个做地图创业的朋友,他公司接了一个海外项目的单子,结果因为数据没有脱敏处理,被相关部门叫停整改了整整三个月。他说那段时间每天失眠,生怕公司就这么黄了。后来他们专门建了一个合规审核组,每个标注点都要经过敏感词库检查,就连“加油站”这种普通标识,也要确认是否在军事禁区附近。
从行业角度看,地图数据标注正从劳动密集型向技术密集型转型。以前拼的是人海战术,谁雇的人多,谁就能更快完成任务。现在不一样了,百度地图的自动化标注率据说已经超过80%,剩下的20%才需要人工介入。但这里面有个悖论:自动化程度越高,对剩余人工标注的质量要求就越高。因为机器搞不定的,往往是最复杂、最模糊的场景,比如老旧小区里错综复杂的小路,或城乡结合部没有名字的土路。这些地方只能靠有经验的老标注员凭直觉判断。
而且地图数据标注已经不只是地图公司的事了。美团、饿了么的骑手配送路线优化,滴滴的司乘匹配调度,甚至气象局的灾害预警系统,都在用地图数据。我见过一个做城市物流的朋友,他公司专门组建了一个小团队负责数据标注,因为通用的地图数据满足不了他们的需求。比如他们需要标出每一个写字楼的侧门位置,因为外卖骑手从正门进去要绕一大圈。这种细节,高德不会帮你标,只能自己动手。说白了,地图数据标注正从“公共基础设施”变成“个性化定制服务”。
说回开头的那条死胡同。我后来投诉了地图APP,第二天就收到了更新提醒,那堵围墙的位置被标注成了“道路施工中”。我猜那个做标注的小伙子,又得加班了。但这就是他的日常——在无数像素点里找出真实世界的模样。地图数据标注看似是技术活,本质上却是对人耐心的极致考验。那些我们习以为常的导航路线,背后是一群人在跟像素死磕。他们可能永远不出名,但这张数字世界的底图,就是他们一笔一笔画出来的。下次导航出错时,骂归骂,但也别忘了一点:这个世界越智能,默默标注数据的人就越不能被忽视。