gpt-engineer 概述
GPT-Engineer 是什么?
GPT-Engineer 是一个创新的开源命令行界面 (CLI) 平台,专为使用 AI 驱动的代码生成进行实验而设计。它最初作为 lovable.dev 的前身创建,这个工具允许开发者用自然语言指定软件需求,并观看像 GPT-4 这样的人工智能系统自动编写和执行代码。
GPT-Engineer 如何工作?
GPT-Engineer 通过一个简单的流程运作:
- 项目设置:用户创建一个项目目录,其中包含一个带有自然语言指令的
prompt文件 - AI 处理:该工具将这些指令发送到 AI 模型(主要是 GPT-4 或替代模型)
- 代码生成:AI 根据提供的规格生成完整的代码库
- 执行:系统可以自动执行和测试生成的代码
- 迭代:用户可以通过额外的提示请求改进和细化
核心功能
- 自然语言到代码:将纯英文描述转化为功能性代码
- 多模型支持:兼容 OpenAI GPT-4、Azure OpenAI、Anthropic 模型以及开源替代方案
- 视觉能力:支持视觉模型的图像输入(UX/架构图)
- 自定义预提示:允许自定义 AI 代理的身份和行为
- 基准测试工具:包含 'bench' 二进制文件,用于测试自定义代理与公共数据集
- 跨平台兼容性:支持 Python 3.10-3.12,并提供 Docker 选项
安装和设置
稳定版本安装
python -m pip install gpt-engineer
开发安装
git clone https://github.com/gpt-engineer-org/gpt-engineer.git
cd gpt-engineer
poetry install
poetry shell
API 密钥配置
用户必须通过环境变量或 .env 文件设置他们的 OpenAI API 密钥:
export OPENAI_API_KEY=[your api key]
使用场景
创建新代码
- 创建一个空的项目文件夹
- 添加一个带有指令的
prompt文件 - 运行:
gpte projects/my-new-project
改进现有代码
- 定位现有代码文件夹
- 在
prompt文件中添加改进指令 - 运行:
gpte projects/my-old-project -i
视觉增强开发
gpte projects/example-vision gpt-4-vision-preview --prompt_file prompt/text --image_directory prompt/images -i
支持的基准测试
GPT-Engineer 目前支持针对以下基准测试:
- APPS 数据集
- MBPP (Mostly Basic Python Problems)
社区还启动了额外的基准测试努力,如其研究材料中所述。
目标受众
- 软件开发者 希望加速原型设计和开发
- AI 研究人员 实验代码生成模型
- 技术团队 寻求自动化重复编码任务
- 教育工作者 教授编程和 AI 概念
- 开源贡献者 对推进 AI 辅助开发工具感兴趣
实际价值
GPT-Engineer 通过以下方式提供重大价值:
- 减少开发时间 通过自动化代码生成
- 降低非专家创建软件的入门门槛
- 启用快速原型设计 和实验
- 促进学习 通过展示 AI 如何将自然语言解释为代码
- 支持研究 在 AI 辅助软件开发领域
社区和治理
GPT-Engineer 项目由长期贡献者的董事会治理,并积极鼓励社区参与。主要贡献者包括 @ATheorell、@similato87、@TheoMcCabe 和 @captivus 等。
与 GPTEngineer.app 的关系
虽然 GPT-Engineer 是原始的开源实验平台,但 GPTEngineer.app 代表其商业演进——一个具有 UI 功能的托管服务,针对非技术用户连接到 git 控制的代码库。商业团队积极支持开源社区。
技术要求
- Python:3.10-3.12(最后支持 3.8-3.9 的版本是 0.2.6)
- API 访问:OpenAI、Azure OpenAI 或替代模型访问
- 存储:足够的生成项目和依赖空间
为什么选择 GPT-Engineer?
GPT-Engineer 以其突出特点脱颖而出:
- 开源性质 允许完全自定义和透明度
- CLI 导向方法 迎合开发者工作流程
- 可扩展性 通过自定义预提示和模型支持
- 活跃社区 持续开发和研究
- 经过验证的记录 在 GitHub 上有 54.9k 星标和 7.3k 分叉
对于对 AI 辅助编码前沿感兴趣的开发者和研究人员,GPT-Engineer 提供了一个健壮、可黑客攻击的平台,用于代码生成技术的实验和创新。
"gpt-engineer"的最佳替代工具
Shell2 是 Raiden AI 提供的 AI 助手交互平台,提供数据分析、处理和生成功能。它具有会话持久性、用户上传、多人协作和不受限制的环境等特性。
GitHub Next 通过原型设计工具和技术来探索软件开发的未来,这些工具和技术将改变我们的工艺。 他们确定构建健康、高效的软件工程团队的新方法。
Relicx 是一款由生成式人工智能驱动的软件测试工具,允许用户使用自然语言在几分钟内创建高质量的端到端测试。它通过自动化用户验收测试的先进功能增强了测试生态系统,并无缝集成到 CI/CD 管道中。
OpenHands是一个AI驱动的软件开发代理,可以修改代码、运行命令、浏览网页和调用API。注册OpenHands Cloud即可开始使用。
BAML是一个开源工具包,用于构建类型安全且可靠的AI应用程序。 使用BAML自信地定义、测试和部署AI代理。 非常适合旨在提高AI管道可靠性的开发人员。
smolagents 是一个简约的 Python 库,用于创建通过代码推理和行动的 AI 代理。它支持模型无关的 LLM、安全沙箱以及与 Hugging Face Hub 的无缝集成,实现高效的基于代码的代理工作流。
Nuanced 通过静态分析和精确的 TypeScript 调用图增强 Cursor 和 Claude Code 等 AI 编码工具,可将令牌支出降低 33%,并提升构建成功率,实现高效、准确的代码生成。
DeepClaude 是一个开源工具,融合 DeepSeek R1 的高级推理与 Claude 的创造力,实现无缝 AI 代码生成。享受零延迟响应、隐私保护和可定制 API——无需注册。
Codex CLI 是 OpenAI 的开源编码代理,在您的终端中运行,提供 AI 驱动的编程任务协助。通过 npm 或 Homebrew 安装,实现无缝集成到您的工作流程中。
Marvin 是一个强大的 Python 框架,用于使用大语言模型 (LLM) 构建 AI 应用。它简化了状态管理、代理协调和结构化输出,适用于开发者创建智能应用。
Continue 是一个开源的持续 AI 平台,可帮助开发人员在其 IDE、终端和 CI 中构建和运行自定义 AI 代码代理,从而加速软件开发。