从测试到开发，我用Trae啃下机器学习算法入门：一个异地程序员的周末血泪史

技术清醒派

2026-07-01 19:34

阅读 1096

写在前面：这篇文章，献给每一个在深夜对着屏幕发呆、怀疑自己是不是选错行的程序员。也献给那个每周五晚上坐高铁来看我的老婆。

一、那个让我决定转行的夜晚

去年十一月的一个周五晚上，深圳北站。

我老婆从广州坐城际过来，拖着个行李箱，里面装着换洗衣服和两盒她妈做的卤牛肉。我们租的房子在龙华，月租3500，一室一厅，隔音差到能听见隔壁打呼噜。

那天晚上她进门第一句话就是："你们公司那个测试岗，你到底还干不干？"

我当时正窝在沙发上刷LeetCode，闻言愣了一下。

"干啊，怎么了？"

"你上个月工资到手多少？"

"15k。"

"房贷5800，房租3500，我那边开销算3000，剩下多少？2700。我们两个人，2700过一个月？"

她没再说下去，但我听懂了。

说实话，当时心里挺不是滋味的。我做测试三年了，从功能测试到自动化测试，Selenium、Appium、JMeter这些工具闭着眼都能搭。但测试岗的天花板，在深圳这个地方，说难听点，就是个"高级点点点"。我见过太多30多岁的测试老哥，要么转管理，要么被优化，要么回老家考公。

"我想转开发。"我说。

她看了我一眼，没反对，也没支持，就说了句："那你周末别打游戏了。"

从那天起，我的周末就再也没碰过王者。

二、转开发，选什么方向？

这是第一个让我头秃的问题。

Java？卷成麻花了，培训班出来的人一抓一大把。前端？Vue、React我也写过，但说实话，前端现在也不轻松。Go？云原生方向确实火，但岗位没那么多。

转折点发生在一个周日的下午。

那天我在GitHub上逛，无意间看到一个叫 Trae 的项目。说实话，一开始我是被名字吸引的——简洁，好记。点进去一看，是个AI辅助开发工具，但真正让我停下来的，是它README里提到的一句话：

"让开发者专注于算法逻辑本身，而非工程细节。"

当时我就想，算法？机器学习？这玩意儿我能学吗？

我本科是普通二本，数学课基本是"及格万岁"，线性代数62分飘过，概率论补考了一次才过。机器学习？听着就头大。

但转念一想，我他妈都决定转行了，还怕什么头大？

于是我做了个决定：用三个月时间，啃下机器学习算法入门。

三、机器学习入门，到底在学什么？

先说结论：机器学习入门，核心就是搞懂几个基础概念，然后动手跑通几个项目。 别一上来就啃《统计学习方法》或者《Pattern Recognition and Machine Learning》，你会死得很惨。

我当时的学习路线是这样的：

3.1 监督学习 vs 无监督学习 vs 强化学习

这三个概念，是机器学习的三大门派。

监督学习（Supervised Learning），说白了就是"有老师教"。你给模型一堆带标签的数据，比如"这张图是猫，那张图是狗"，模型学着学着就会分类了。常见的算法有线性回归、逻辑回归、决策树、SVM、随机森林。

无监督学习（Unsupervised Learning），就是"自学成才"。数据没有标签，模型自己找规律。比如聚类（K-Means）、降维（PCA）。你给它一堆用户数据，它自己把相似的用户分到一组。

强化学习（Reinforcement Learning），这个比较玄学，本质是"试错学习"。模型在环境里做动作，环境给反馈（奖励或惩罚），模型不断优化策略。AlphaGo就是这玩意儿。

我当时花了整整两个周末，才把这三个概念搞清楚。不是概念难，是网上的教程要么太学术，要么太水。有些博客上来就推公式，我一看Σ和∫就犯困；有些又太浅，看完跟没看一样。

3.2 损失函数、梯度下降、过拟合

这三个词，是机器学习入门的"三座大山"。

损失函数（Loss Function），就是衡量模型预测值和真实值差距的指标。差距越大，loss越大，模型越菜。常见的有MSE（均方误差）、Cross-Entropy（交叉熵）。

梯度下降（Gradient Descent），是模型"学习"的核心方法。你可以理解为：模型站在一个山上，要找到最低点（loss最小的地方），它就往最陡的下坡方向走一步，然后再走一步，直到走到谷底。学习率（Learning Rate）就是每步走多远。走太大容易跳过谷底，走太小又太慢。

过拟合（Overfitting），就是模型"死记硬背"了。训练集上表现贼好，测试集上一塌糊涂。就像有些同学，刷题库能考90分，换套题就懵了。解决方法有正则化、Dropout、增加数据量等。

我记得有天晚上，我老婆都睡了，我一个人在客厅对着Jupyter Notebook调参。调到一个凌晨两点，终于把过拟合的问题解决了，测试集accuracy从68%提到85%。当时那种成就感，比当年追到我老婆还爽。

3.3 特征工程：脏活累活但极其重要

很多新手（包括当时的我）会觉得，机器学习就是选个模型、调个参。大错特错。

特征工程（Feature Engineering） 才是决定模型上限的关键。你给模型喂什么数据，比选什么模型重要得多。

举个例子：你要预测房价，原始数据里有"房屋面积"和"房间数量"。但如果你能构造一个新特征"平均每间房面积"，模型可能学得更好。这就是特征工程的魅力。

我当时做了一个房价预测的项目，数据是从Kaggle上下载的。光是清洗数据、处理缺失值、做特征编码，就花了我一周的业余时间。但最后模型效果，比直接扔原始数据好了将近20%。

四、Trae：让我少走了很多弯路

说回Trae。

为什么我要单独拿出一个章节来说它？因为在我入门机器学习的过程中，Trae真的帮了大忙。

4.1 项目搭建，一键搞定

以前我搭一个机器学习项目，光是配环境就能搞半天。Python版本、依赖库、虚拟环境……有时候一个pip install报错就能让我debug两小时。

用Trae之后，它帮我自动生成了项目结构：

ml-beginner/
├── data/
│   ├── raw/
│   └── processed/
├── notebooks/
│   ├── 01_eda.ipynb
│   ├── 02_feature_engineering.ipynb
│   └── 03_model_training.ipynb
├── src/
│   ├── data_loader.py
│   ├── feature_engineer.py
│   └── model.py
├── requirements.txt
└── README.md

说实话，看到这个项目结构的时候，我内心是有点小激动的。做了三年测试，我习惯了"在别人的框架里点点点"，第一次自己从零搭一个项目，那种感觉就像——嗯，就像自己生了个孩子。

4.2 代码辅助，效率翻倍

Trae的代码补全和生成功能，对我这种半路出家的人来说太友好了。

比如我想写一个数据预处理的pipeline，以前我得去Stack Overflow上抄代码，然后一行行改。现在我只需要描述需求："帮我写一个pandas的数据预处理流程，包括缺失值填充、类别变量编码、数值变量标准化"，Trae直接给我生成了一段干净的代码：

import pandas as pd
from sklearn.preprocessing import StandardScaler, LabelEncoder

def preprocess_data(df):
    # 缺失值填充
    numeric_cols = df.select_dtypes(include=['float64', 'int64']).columns
    categorical_cols = df.select_dtypes(include=['object']).columns
    
    for col in numeric_cols:
        df[col].fillna(df[col].median(), inplace=True)
    
    for col in categorical_cols:
        df[col].fillna(df[col].mode()[0], inplace=True)
    
    # 类别变量编码
    le = LabelEncoder()
    for col in categorical_cols:
        df[col] = le.fit_transform(df[col])
    
    # 数值变量标准化
    scaler = StandardScaler()
    df[numeric_cols] = scaler.fit_transform(df[numeric_cols])
    
    return df

代码质量比我自己在网上抄的好多了，而且注释清晰，逻辑分明。

4.3 把项目推到GitHub

学机器学习，一定要把项目开源到GitHub上。这不是为了装逼，而是逼自己把代码写规范。

我在GitHub上建了个仓库，叫ml-from-zero，把每周的学习笔记和代码都推上去。说实话，刚开始star数是个位数，但我老婆每次看到我的GitHub贡献格子变绿，都会说"你看，又绿了一块"。

嗯，她可能不太懂GitHub，但她懂我的努力。

五、那些差点放弃的瞬间

转行这条路，真不是一帆风顺的。

第一个坎：数学。

虽然我前面说了"别一上来就啃数学"，但学到后面，你会发现绕不开。比如逻辑回归的推导，需要用到sigmoid函数和最大似然估计；SVM需要理解拉格朗日对偶性。我本科数学底子差，每次看公式都像看天书。

有天晚上，我在推导梯度下降的数学公式，推导了两个小时都没推出来。当时真的崩溃了，把电脑一合，跟我老婆说："我是不是太蠢了，这都学不会。"

她当时在敷面膜，看了我一眼说："你当年追我的时候，被拒了三次都没放弃，现在推导个公式就放弃了？"

……行吧，你赢了。我又把电脑打开了。

第二个坎：时间。

异地+转行，时间是真的不够用。工作日白天要上班，晚上跟老婆视频，能学习的时间也就一两个小时。周末她过来，我白天学习，晚上陪她。有时候她看我对着屏幕一坐就是一下午，会默默给我切盘水果放桌上。

那段时间，我的作息基本是：

周一到周五：7点起床，8点到公司，晚上7点下班，8点到10点学习，10点到12点跟老婆视频
周六：老婆过来，白天学习，晚上陪她出去吃饭逛街
周日：上午学习，下午送她去高铁站

三个月，没打过一次王者，没看过一部完整的电影。

第三个坎：自我怀疑。

学到第二个月的时候，我已经能跑通一些基础的机器学习项目了。但每次在GitHub上看到别人的项目，star几百几千，代码写得像艺术品，我就觉得自己是个渣渣。

有天我在一个技术群里问："28岁转行机器学习，还来得及吗？"

群里有个老哥回我："来得及，但你要接受一个事实——你不是天才，你只能靠时间和努力来弥补。"

这句话我记到现在。

六、转机：从测试到开发的offer

三个月后，也就是今年二月，我开始投简历。

说实话，一开始投的都是"机器学习工程师"，结果石沉大海。后来我想通了，先转开发，再慢慢往算法方向靠。于是调整策略，投"Python后端开发"和"数据开发"。

面试过程就不细说了，总之被虐了很多次。但有一个面试让我印象很深。

面试官问我："你做过什么机器学习项目？"

我把GitHub上的ml-from-zero仓库打开，给他讲了我做的房价预测、情感分析、图像分类三个项目。从数据清洗到特征工程到模型选择到调参优化，讲了一个小时。

面试官最后说："你的项目不算特别复杂，但能看出来你是真的动手做了，而且代码规范做得不错。"

最后，我拿到了一个数据开发的offer，月薪22k。

从15k到22k，涨了7k。说多不多，说少不少。但对我来说，这不只是7k的事，而是——我终于迈出了那一步。

七、给想入门机器学习的朋友一些建议

7.1 别贪多，先把基础概念搞透

机器学习的东西太多了，深度学习、NLP、CV、推荐系统……你不可能一口吃成胖子。先把监督学习、无监督学习、损失函数、梯度下降、过拟合这些基础概念搞明白，比什么都重要。

7.2 动手做项目，别只看不练

看十遍教程，不如自己写一遍代码。找一个Kaggle上的入门比赛，从数据加载到模型训练到结果提交，完整跑一遍。你会遇到无数问题，但解决问题的过程，才是真正学习的过程。

7.3 善用工具，别死磕

像Trae这样的AI辅助工具，能帮你节省大量时间。配环境、写模板代码、debug……这些重复性的工作，没必要自己死磕。把时间花在理解算法逻辑上，才是正事。

7.4 把代码推到GitHub

这不是为了虚荣心，而是为了逼自己写规范的代码。同时，GitHub上的项目也是你面试时最好的作品集。

7.5 找个同行的人

转行路上最可怕的不是技术难，而是孤独。有个能一起讨论问题、互相打气的人，真的能帮你撑过很多想放弃的瞬间。

八、写在最后

上周五晚上，老婆又坐城际过来了。

吃饭的时候她问我："你现在还焦虑吗？"

我想了想说："焦虑还是有，但没以前那么严重了。至少现在我知道自己在往哪走。"

她笑了笑，给我夹了块牛肉。

转行这条路，没有捷径。你能做的，就是把每一天过好，把每一个概念搞懂，把每一行代码写扎实。剩下的，交给时间。

最后送一句我很喜欢的话，来自GitHub上一个大佬的README：

"The best time to plant a tree was 20 years ago. The second best time is now."

种一棵树最好的时间是二十年前，其次是现在。

共勉。

如果你也在转行的路上，欢迎在评论区聊聊你的故事。一个人走得快，一群人走得远。

我的GitHub：github.com/ml-from-zero（化名），欢迎star，欢迎提issue交流。

标签:Trae项目GitHub

最热最新

暂无评论

为你推荐

暂无相关推荐