被裁后,我在光谷接了个计算机视觉外包:从焦虑到月入22K的真实经历
上周五晚上十点半,我还在光谷软件园C2栋16楼的工位上调试YOLOv8模型。窗外霓虹闪烁,楼下关东园路上早已没了行人,只有外卖小哥骑着电动车匆匆掠过。显示器右下角的时间跳到22:37,我揉了揉酸胀的眼睛,喝了口已经凉透的瑞幸——这是本周第三次加班到这个时候。
但你可能不知道,三个月前,我还在另一家公司收拾纸箱,被HR“优化”出局。
一、裁员那天,武汉下着小雨
那是去年十月十二号,一个阴沉的周五。早上刚开完站会,技术总监把我叫进会议室。桌上放着一杯没喝完的茶颜悦色(公司福利),他语气平和地说:“公司战略调整,你的岗位……暂时不需要了。”
我懵了几秒,然后条件反射地问:“N+1给多少?”
“按合同来,税前15K。”他说完就低头看手机,仿佛在等我离开。
走出大楼时,天空飘着细雨。我没带伞,也不想打车——省点是一点。走到光谷广场地铁站的路上,脑子里全是房贷、孩子奶粉钱、还有老婆上个月刚查出甲状腺结节需要复查。当时真的很焦虑,甚至有点自我怀疑:干了五年全栈,难道真的要转行送外卖?
回家后,老婆没说什么,只是默默煮了碗热干面。晚上躺在床上,她轻声问我:“要不要试试接外包?你不是老说朋友有项目找你吗?”
我翻了个身,看着天花板,心想:是啊,与其等大厂施舍,不如自己当老板。
二、第一个CV项目:客户要的是“能落地”,不是论文
两周后,一个前同事介绍了个活儿:帮一家做智能仓储的武汉本地公司开发一个包裹识别系统。需求很简单:摄像头拍传送带上的快递包裹,自动识别尺寸、颜色、是否有破损。
听起来不难?可当我真正上手才发现,工业场景的CV远比Kaggle竞赛复杂得多。
客户用的是海康威视的普通摄像头,分辨率不高,光线还经常变化。更坑的是,他们仓库里包裹堆得乱七八糟,有些还贴着反光胶带。我一开始直接套用ResNet+OpenCV的组合,结果准确率连60%都不到。
那几天我几乎住在了GitHub和Stack Overflow上。白天改代码,晚上看论文,凌晨三点还在调参。有一次调试到崩溃,直接在群里吐槽:“这破数据集比我家猫还难搞!”
后来我意识到:算法再牛,不能跑在客户的老旧服务器上也是白搭。于是决定换思路——不用重型模型,改用轻量级的YOLOv5s + 自研的数据增强策略。关键是,我用OpenCV做了动态曝光补偿,解决了光线突变的问题。
工具链也重新梳理:
- 标注工具:LabelImg(虽然简陋,但快)
- 训练框架:PyTorch + Ultralytics(YOLO官方库,文档友好)
- 部署环境:Docker + Flask API(客户IT只会装Docker)
- 监控:Prometheus + Grafana(方便他们运维看)
最终交付时,模型在RTX 3060上跑到了45 FPS,准确率92.3%。客户老板亲自请我吃了顿亢龙太子——虽然没涨钱,但他说:“下次还有活,只找你。”
三、从“会写代码”到“解决问题”:外包教会我的事
说实话,以前在大厂,我更多是“模块搬运工”。产品经理说要个OCR功能,我就调阿里云API;说要做人脸检测,就集成Face++ SDK。根本不用思考底层逻辑,更别说优化部署了。
但做外包完全不同。客户不关心你用了什么SOTA(State-of-the-Art)算法,他们只问一句:“能不能跑起来?稳不稳定?贵不贵?”
这逼着我重新审视自己的技术栈。我开始深入研究:
- 模型压缩:用TensorRT量化YOLO,体积从150MB压到40MB
- 边缘部署:把模型塞进Jetson Nano,实测功耗<10W
- 故障自愈:加了心跳检测和自动重启机制,避免半夜报警
最让我自豪的是,我把整个流程做成了一套可复用的CV工程模板。现在接新项目,三天就能跑通MVP(最小可行产品)。这比在大厂写周报、对齐OKR有价值多了。
上个月,这个模板被另一个客户看中,直接打包买断,给了我3万块。加上其他零散项目,我的月收入从被裁时的0,涨到了22K——比之前工资还高。
四、教程、算法、工具:别再被“炫技”绑架了
很多人学计算机视觉,一上来就追ViT、SAM、Stable Diffusion,觉得不用最新算法就是落伍。但现实是:90%的商业项目,根本用不到那么高级的东西。
我整理了一份“实战优先级清单”,分享给想入行的朋友:
教程:别死磕理论,先跑通一个完整Pipeline
- 推荐Ultralytics官方YOLO教程(https://docs.ultralytics.com/),中文文档很全
- 李沐的《动手学深度学习》第13章,讲部署特别实在
- B站有个UP主“跟李沐学AI”,他的实战系列比很多付费课都强
算法:选对场景比追新更重要
- 工业检测:YOLO系列 + EfficientNet(轻量、快、准)
- 人脸识别:InsightFace(开源、支持1:N检索)
- OCR:PaddleOCR(中文场景无敌,支持表格识别)
- 别碰Transformer除非你有GPU集群——真的,别碰
工具:工程化能力才是护城河
- 标注:CVAT(比LabelImg强大,支持团队协作)
- 训练:Weights & Biases(实验跟踪神器,免费版够用)
- 部署:ONNX + TensorRT(跨平台推理必备)
- 监控:ELK Stack(日志分析,排查问题快如闪电)
记住:客户不为你的F1-score买单,只为“少出错、少宕机、少花钱”买单。
五、在光谷,做一个“野生全栈”的思考
现在,我租的还是光谷软件园附近那个3500一个月的一居室。每天早上七点起床,给孩子做完早餐,八点打开电脑。没有打卡,没有晨会,但每一分收入都看得见摸得着。
有时候也会累,也会怕。怕项目断档,怕技术过时,怕哪天又“被优化”——虽然是自己优化自己(笑)。
但我越来越清楚:程序员的核心竞争力,从来不是某家公司的title,而是解决真实问题的能力。
计算机视觉也好,大模型也罢,技术永远在变。但只要你能站在客户角度,把“模糊需求”变成“稳定服务”,你就永远有饭吃。
上周和老婆视频,她说:“你现在眼睛里有光了。”
我说:“因为我知道,代码不仅能跑在服务器上,还能撑起一个家。”
如果你也在武汉,也在焦虑职业方向,或者正想找人合作CV项目——欢迎私信。我不收咨询费,但可能会请你喝杯茶颜悦色(这次我请)。
技术人的春天,不在大厂PPT里,而在每一个被解决的真实问题中。

评论 0