OpenAI API使用教程：快速接入AI能力

热更新信徒

2025-12-15 10:54

阅读 3322

上周五晚上九点半，我蹲在工位上啃着冷掉的麦当劳，盯着屏幕上那个该死的需求文档发呆。产品经理又双叒叕提了个“小需求”——要在我们现有的内容审核系统里加个AI辅助判断功能，说是要“提升用户体验”。我翻了翻日历，距离上线还剩三天，而我的房贷还款日就在下周二。

作为一个在深圳科技园某鹅厂系公司搬砖的北漂程序员，我已经习惯了这种节奏。白天写业务代码，晚上研究怎么用AI让自己少写点代码。毕竟背了30年房贷的人，真的没时间慢慢造轮子。这次正好借着项目机会，好好折腾一下OpenAI API。

为啥要折腾OpenAI API？

其实我们团队之前就有做内容审核的算法模型，基于BERT微调的，准确率大概85%左右。但问题在于：

维护成本高：每次规则变动都要重新训练，GPU服务器费用蹭蹭往上涨
覆盖场景有限：遇到新类型的违规内容就傻眼
响应速度慢：模型推理要200ms+，用户投诉卡顿

产品经理这次的要求其实很合理——希望能在现有系统基础上，增加一个AI辅助判断层。如果我们的算法模型不确定（置信度<0.7），就调用外部AI服务做二次确认。

这不就是OpenAI API的经典应用场景吗？而且按调用量付费，对我们这种小项目来说成本可控。更重要的是，我再也不用半夜被运维叫起来处理模型服务挂掉的问题了！

从零开始接入：别被文档吓到

说实话，第一次看OpenAI的官方文档时，我是懵的。各种model、parameter、token的概念堆在一起，感觉比我们公司的晋升文档还复杂。但实际动手后发现，核心就那么几行代码。

第一步：搞个API Key

这个最简单，去 platform.openai.com 注册账号就行。不过要注意：

新账号有免费额度（$5），够你折腾一阵子了
国内访问可能需要科学上网（别问我怎么知道的）
记得把API Key存到环境变量里，别提交到Git（血泪教训）

# .env文件
OPENAI_API_KEY=your-api-key-here

第二步：选对Model很重要

OpenAI现在有好几个模型，选择困难症患者慎入：

Model	特点	适用场景	价格(每1K tokens)
gpt-3.5-turbo	快、便宜、够用	大多数业务场景	$0.0015
gpt-4	强大但贵	复杂推理、高质量输出	$0.03
gpt-4-turbo	gpt-4的优化版	需要最新知识的场景	$0.01

对于我们内容审核这种场景，gpt-3.5-turbo完全够用了。毕竟不是让AI写诗，而是做是非判断。省下的钱还能多买两杯瑞幸续命。

第三步：写个简单的封装

直接调用官方SDK是最稳妥的。我用Python写了个简单的wrapper，方便后续扩展：

import os
import openai
from typing import List, Dict, Any

class OpenAIClient:
    def __init__(self):
        self.client = openai.OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
        self.model = "gpt-3.5-turbo"
    
    def classify_content(self, text: str, categories: List[str]) -> Dict[str, Any]:
        """
        内容分类函数
        :param text: 待审核的文本
        :param categories: 可能的违规类别
        :return: 分类结果和置信度
        """
        # 构造system prompt，告诉AI我们的具体需求
        system_prompt = f"""
        你是一个内容安全审核专家，请严格按照以下规则判断：
        1. 只能从以下类别中选择：{', '.join(categories)}
        2. 如果内容正常，返回"normal"
        3. 返回格式必须是JSON：{{"category": "类别", "confidence": 置信度0-1}}
        4. 不要解释，只返回JSON
        """
        
        try:
            response = self.client.chat.completions.create(
                model=self.model,
                messages=[
                    {"role": "system", "content": system_prompt},
                    {"role": "user", "content": f"请审核以下内容：{text}"}
                ],
                temperature=0.1,  # 降低随机性，让结果更稳定
                max_tokens=100,
                response_format={"type": "json_object"}  # 强制返回JSON
            )
            
            result = response.choices[0].message.content
            return json.loads(result)
            
        except Exception as e:
            # 这里要记录详细的错误信息，方便排查
            logger.error(f"OpenAI API调用失败: {str(e)}")
            return {"category": "error", "confidence": 0.0}

注意几个关键点：

temperature设为0.1：内容审核这种场景要确定性，不要创意
response_format指定JSON：避免解析错误，这个功能太香了
详细的system prompt：这是调教AI的关键，相当于给算法定规则

踩坑实录：那些让我想砸电脑的时刻

坑1：Token计算的水很深

第一次测试时，我直接扔了一篇2000字的文章给API，结果返回错误：Request too large for model。查了半天才知道gpt-3.5-turbo的上下文限制是16K tokens，但实际可用的更少。

后来学乖了，先计算token数量：

import tiktoken

def count_tokens(text: str, model: str = "gpt-3.5-turbo") -> int:
    """计算文本的token数量"""
    encoding = tiktoken.encoding_for_model(model)
    return len(encoding.encode(text))

# 使用前先检查
if count_tokens(user_input) > 15000:  # 留点余量
    user_input = user_input[:10000]  # 简单截断

坑2：中文处理的玄学

有次测试发现，同样一段违规内容，英文描述能准确识别，中文就漏检。后来发现是因为prompt里混用了中英文标点，AI直接懵了。

解决方案很简单：统一用中文标点，prompt也用中文写。虽然看起来有点怪，但效果立竿见影。

# 错误示范
system_prompt = "You are a content moderator. Categories: spam, porn, violence"

# 正确示范  
system_prompt = "你是一个内容审核员。违规类别包括：垃圾广告、色情低俗、暴力恐怖"

坑3：Rate Limiting的痛

上线第一天，流量一上来就被限流了。OpenAI默认的QPS限制很严格（大概是每分钟3500个tokens），而我们的高峰期每秒要处理50+请求。

临时解决方案是加缓存 + 降级策略：

# 简单的本地缓存
from functools import lru_cache

@lru_cache(maxsize=1000)
def cached_classify(text_hash: str, text: str) -> Dict:
    return openai_client.classify_content(text, CATEGORIES)

# 降级策略：API失败时直接放行（风险可控）
def safe_classify(text: str) -> Dict:
    try:
        return openai_client.classify_content(text, CATEGORIES)
    except RateLimitError:
        logger.warning("OpenAI rate limited, fallback to pass")
        return {"category": "normal", "confidence": 0.6}  # 保守策略

长期方案当然是加队列和异步处理，但这需要改动现有架构，得等下个版本了（产品经理表示理解，毕竟他也怕线上事故）。

和现有算法模型的融合

这才是最有意思的部分！我们不是要完全替换现有系统，而是做增强。

架构设计

用户提交内容
    ↓
现有BERT模型预测
    ↓
置信度 ≥ 0.7? ──是──→ 直接返回结果
    ↓否
调用OpenAI API二次确认
    ↓
综合两个结果做最终判断

结果融合策略

最开始我想用简单的加权平均，但效果不好。后来改成了决策树的方式：

def merge_results(bert_result: Dict, openai_result: Dict) -> Dict:
    """
    融合两个模型的结果
    规则：
    1. 如果两个都说是违规，那就违规
    2. 如果BERT很确定（>0.9）但OpenAI说正常，相信BERT
    3. 其他情况，以OpenAI为准（因为它的知识更新）
    """
    bert_category = bert_result["category"]
    bert_conf = bert_result["confidence"]
    openai_category = openai_result["category"]
    openai_conf = openai_result["confidence"]
    
    # 两个都说违规
    if bert_category != "normal" and openai_category != "normal":
        return {
            "category": bert_category,  # 用我们自己的分类体系
            "confidence": max(bert_conf, openai_conf)
        }
    
    # BERT很确定是违规
    if bert_category != "normal" and bert_conf > 0.9:
        return bert_result
    
    # 默认信任OpenAI（因为它见过更多新类型）
    return openai_result

效果对比

上线一周后的数据让我惊呆了：

指标	纯BERT模型	BERT+OpenAI	提升
准确率	85.2%	92.7%	+7.5%
召回率	78.3%	89.1%	+10.8%
平均响应时间	210ms	180ms	-14%
月成本	¥8000 (GPU)	¥3000 + ¥1200 (API)	-35%

成本反而降了！因为我们可以把GPU实例规格降下来，大部分流量走便宜的API。这波操作连财务同事都夸我会省钱（虽然房贷还是还不完）。

性能优化：让API调用飞起来

虽然OpenAI API本身很快（平均80ms），但在高并发场景下还是有优化空间。

批量处理

OpenAI支持批量请求，但需要提前准备：

# 准备批量数据
batch_data = []
for text in texts:
    batch_data.append({
        "custom_id": f"req-{uuid.uuid4()}",
        "method": "POST",
        "url": "/v1/chat/completions",
        "body": {
            "model": "gpt-3.5-turbo",
            "messages": [{"role": "user", "content": text}],
            "temperature": 0.1
        }
    })

# 创建批量任务
batch_job = client.batches.create(
    input_file_id=input_file.id,
    endpoint="/v1/chat/completions",
    completion_window="24h"
)

不过批量处理有延迟（最长24小时），适合离线场景。我们的实时审核还是用单次调用。

连接复用

官方SDK默认会复用连接，但如果你自己封装HTTP客户端，记得开启keep-alive：

# requests示例
session = requests.Session()
adapter = requests.adapters.HTTPAdapter(
    pool_connections=10,
    pool_maxsize=20,
    max_retries=3
)
session.mount('https://', adapter)

缓存策略升级

除了前面提到的LRU缓存，我们还加了Redis分布式缓存：

import hashlib
import redis

redis_client = redis.Redis(host='localhost', port=6379, db=0)

def get_cached_result(text: str) -> Optional[Dict]:
    key = f"openai_cache:{hashlib.md5(text.encode()).hexdigest()}"
    cached = redis_client.get(key)
    if cached:
        return json.loads(cached)
    return None

def set_cached_result(text: str, result: Dict, expire: int = 3600):
    key = f"openai_cache:{hashlib.md5(text.encode()).hexdigest()}"
    redis_client.setex(key, expire, json.dumps(result))

缓存命中率能达到40%左右，大大减少了API调用量。

给 fellow 程序员的建议

折腾完这个项目，我最大的感受是：AI不是要取代我们，而是帮我们更好地完成工作。

关于Prompt Engineering

别小看写prompt这件事，它本质上就是在定义算法的边界条件。好的prompt应该：

明确输入输出格式
列出所有可能的类别/选项
给出具体的判断标准
限制AI的发挥空间（业务场景不需要创意）

关于成本控制

OpenAI API虽然按量付费，但如果不加控制，账单还是会吓死人。建议：

设置用量告警（OpenAI后台可以配）
对长文本做预处理（摘要、分段）
合理设置max_tokens，避免AI废话连篇
用gpt-3.5-turbo能解决的问题就别上gpt-4

关于监控和日志

一定要记录完整的调用日志，包括：

输入文本（脱敏后）
API响应
处理耗时
最终决策

这样出了问题才能快速定位。我们甚至做了个内部dashboard，实时显示API调用成功率和成本。

写在最后

现在这个系统已经稳定运行一个月了，准确率提升明显，用户投诉少了，我也终于能在晚上十点前下班（虽然还是要还房贷）。最重要的是，我学会了怎么在现有系统里优雅地集成AI能力，而不是推倒重来。

技术债还是要还的，但有了AI这个新工具，至少不用一个人扛。下次产品经理再提“小需求”，我可能真的会笑出声——因为我知道，有些事情，让AI去做就好了。

对了，如果你也在深圳，欢迎约咖啡聊聊技术（我请，反正省下的GPU费用够买一年的瑞幸）。只是别问我在哪家公司，毕竟...你懂的 😅

标签:项目算法

最热最新

暂无评论

为你推荐

暂无相关推荐