技术探索与实践踩坑记录:从零开始学AIGC技术
开篇:什么是AIGC?它能用来做什么?

AIGC,全称是人工智能生成内容(Artificial Intelligence Generated Content),通俗点讲,就是让AI来帮我们“写文章”、“画图”、“做视频”甚至“编代码”。
你可能已经用过一些AIGC工具,比如:
- 用通义千问、ChatGPT回答问题、写作文
- 用Stable Diffusion或Midjourney生成图像
- 用剪映AI配音给视频添加旁白
这些背后其实都有一个强大的AI模型在默默工作。而我们要做的,就是学会怎么使用它们、训练它们,甚至自己搭建一个小系统。
本教程将带你从零开始,一步步体验AIGC的开发过程,教你如何搭建环境、运行项目,并避免常见的“踩坑”。
环境准备:新手也能轻松搞定的开发环境搭建

要搞技术,第一步通常是装软件和配置环境。虽然听起来有点复杂,但别担心,我们一步一步来。
步骤一:安装 Python
Python 是 AIGC 领域最常用的语言。我们需要先安装它。
- 前往 Python官网
- 下载适合你操作系统的版本(推荐 3.9~3.11)
- 安装时记得勾选 Add to PATH
- 打开终端(Mac/Linux)或命令提示符(Windows),输入:
python --version
如果显示 Python 版本号,说明安装成功!
步骤二:安装 pip(Python包管理器)
pip 是用来下载各种工具的“万能钥匙”。一般安装完 Python 后会自带。验证一下:
pip --version
步骤三:安装 Git(代码仓库工具)
Git 官网,下载安装即可。用于获取开源项目代码。
步骤四:安装 Anaconda(可选但推荐)
Anaconda 是一个虚拟环境管理工具,特别适合初学者隔离项目依赖。
- 前往 Anaconda官网
- 根据系统下载并安装
- 创建虚拟环境(例如命名为 aigc_env):
conda create -n aigc_env python=3.10
conda activate aigc_env
核心概念:看懂AIGC世界的三个关键词

下面这几个词是你在学习AIGC过程中肯定会碰到的,咱们用简单的话解释清楚。
1. 模型(Model)
模型就像是 AI 的大脑,它里面存储了大量知识。你可以把它想象成一本超级厚的百科全书,只不过这本“书”不是人写的,而是通过大量数据训练出来的。
比如:
- 文字生成模型:如 GPT、LLaMA
- 图像生成模型:如 Stable Diffusion、DALL·E
2. 提示词(Prompt)
提示词是你对 AI 的“提问方式”,就像考试时的题目。AI 是根据你的提示词来产生结果的。
例如,你想让 AI 写一篇《我的梦想》作文,你就得写一句 Prompt:
“请帮我写一篇关于‘我的梦想’的小学生作文。”
Prompt 的质量直接影响最终结果的质量,所以你要学会怎么“说话”。
3. 推理(Inference)
推理是指 AI 模型根据输入的信息生成结果的过程。你输入一条提示词,AI 处理后输出一段文字或一幅图片,这个过程就是推理。
实战项目:跟着我一起写一个文字生成小工具

我们来做个小项目:用 Python 和 HuggingFace 上的预训练模型,实现一个简单的文字生成小工具。
第一步:安装必要库
在你的虚拟环境中执行以下命令:
pip install transformers torch
第二步:编写代码
创建一个文件 text_generator.py,内容如下:
from transformers import pipeline
# 加载预训练的文本生成模型
generator = pipeline('text-generation', model='distilgpt2')
# 输入你的提示词
prompt = "春天来了,天气变得"
# 让模型生成文本
result = generator(prompt, max_length=50, num_return_sequences=1)
# 输出生成的结果
print(result[0]['generated_text'])
第三步:运行程序
在终端中执行:
python text_generator.py
你会看到类似这样的输出:
春天来了,天气变得温暖起来,小鸟们在枝头欢快地歌唱,花儿也在阳光下绽放……
小知识点补充:
distilgpt2是一个轻量级的英文语言模型,中文效果一般- 如果你想用中文模型,可以试试阿里开源的
Qwen或chatglm
后面我们会详细介绍怎么切换中文模型,先打好基础最重要。
常见问题:新手踩坑合集 & 解决方案
❓问题一:为什么运行代码时报错 No module named 'transformers'?
✅ 原因:没安装对应的库
✅ 解决方法:确保你已经运行过:
pip install transformers torch
❓问题二:模型加载很慢,卡住了?
✅ 原因:首次加载模型时需要从网上下载,网络不好就会卡住
✅ 解决方法:
- 检查网络连接
- 使用国内镜像安装库,例如:
pip install transformers -i https://pypi.tuna.tsinghua.edu.cn/simple
❓问题三:生成的文字乱七八糟?
✅ 原因:Prompt 不够清晰,或者模型本身不适合这个任务
✅ 解决方法:
- 改善提示词内容,给出更明确的要求
- 尝试换不同的模型看看效果
❓问题四:想用本地GPU加速怎么办?
✅ 前提条件:你的电脑有英伟达显卡,并已安装 CUDA 驱动
✅ 解决方法:
- 安装支持 GPU 的 PyTorch:
pip install torch --extra-index-url https://download.pytorch.org/whl/cu118
然后修改代码启用 GPU:
import torch
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
# 修改模型加载部分(以 Qwen 为例)
from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="auto")
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B")
学习建议:下一步该学什么?
恭喜你完成了第一个AIGC小项目!这只是个开始。接下来你可以朝着以下方向继续深入:
🔹 方向一:精通Prompt工程
- 学习如何写出更好的提示词(Prompt Engineering)
- 掌握结构化提示模板、Few-shot等高级技巧
🔹 方向二:了解大模型原理
- 学习 Transformer 架构的基本原理
- 掌握注意力机制、位置编码等核心概念
🔹 方向三:尝试本地部署模型
- 学会在本地部署 LLaMA、ChatGLM 等模型
- 掌握 GGUF、LoRA、微调(Fine-tuning)等进阶技术
🔹 方向四:结合业务实战应用
- 结合 Web 前端 + AI 背后,开发聊天机器人网页
- 用 AIGC 自动生成营销文案、产品描述等内容
- 利用 AI 绘图工具设计海报、宣传图等
总结:坚持探索,不惧踩坑

作为一位初学者,遇到问题、踩坑都是正常的。关键是:
- 不要怕动手实验
- 多查资料、多动手改代码
- 保持好奇心和耐心
AIGC 是一个快速发展的领域,现在正是最好的入门时机。希望这篇教程能成为你探索之路的第一块垫脚石!
如果你喜欢这种教学风格,欢迎订阅后续课程,我们将继续深入讲解:如何微调模型、如何打造属于你自己的AI助手、如何把AI融入实际项目等进阶主题!
🔍 关键词速记表
| 关键词 | 中文解释 | 用途 |
|---|---|---|
| AIGC | 人工智能生成内容 | 让 AI 自动创作内容 |
| Model | 模型 | 类似 AI 的大脑 |
| Prompt | 提示词 | 给 AI 的“问题” |
| Inference | 推理 | AI 根据输入生成结果 |
| Pipeline | 流水线 | 快速调用模型的方法 |
🎯 课后练习
- 尝试修改上面的例子,使用不同提示词生成更多类型的句子
- 在 HuggingFace 上找一个你喜欢的模型,试着运行它的 demo
- 把你生成的内容保存到一个
.txt文件中
如果你遇到了任何困难,欢迎留言交流,我们一起踩坑、一起成长!🌟

评论 0